태그(tag)
어떤 정보에 메타데이터로 부여된 키워드 또는 분류이다. 일반적인 분류 체계와는 다른 어느 하나의 정보에는 여러 개의 태그가 붙어 그 정보를 다양한 면에서 연관성을 보여 줄 수 있으며 이렇게 제공된 정보나 자료는 접근이 쉽게 해주어 손쉽게 그 정보를 검색하고 노출시키고 분류하거나 다른 자료와 엮어 네트워크로 만드는 일을 쉽게 해 준다.
태그는 보통 그 자료를 만든 사람이나 자료를 이해하거나 찾은 사람이 붙일 수 있다. 그래서 태그는 정식의 분류의 용어와 체계를 가지지 않고 비교적 자유로운 형태나 주관적인 관점에서 기록될 수 있다. 이러한 특징 때문에 태그는 동적이고 유연한 맥락적 메타데이터 정보로 날짜, 시간, 제목 같은 메타데이터 요소들과는 구분된다. 태그로 쓰인 키워드는 그 본문 안의 정보에는 기록되지 않을 수 있으며 음악, 그림과 같이 문자로 그 내용이 기록되지 않아 검색이 어려운 인터넷의 정보 객체들도 문자를 입력함으로써 검색할 수 있게 한다. 보통 태그는 한 낱말로 많이 이뤄져 있지만, 여러 개의 낱말이 하나의 개념을 나타내어 입력되기도 한다.
특히 방대한 정보가 생성, 교환, 공유되는 인터넷에서는 어떤 데이터를 찾기 위해 태그를 사용함으로써 원하는 정보에 매우 쉽게 접근할 수 있게 하는 검색성을 갖게 한다.
태그를 이용한 서비스
태그는 웹 2.0 서비스를 가능하게 하는 핵심적인 내용 중 하나이다. 다음의 사이트들에는 사용자들의 자발적인 태그 입력을 통해 콘텐츠들을 검색하여 제공하는 다양한 서비스를 제공하고 있다. 이러한 사이트들에서 전통적인 분류 방식인 택소노미(Taxonomy)와는 차별화된 단순히 어떤 개인의 차원이 아니라 사회적 집단적 차원의 지식을 공유하고자 하는 이상을 가진 포크소노미(Folksonomy)를 실현한다.
웹 사이트
델리셔스[깨진 링크(과거 내용 찾기)] - 사회관계적 북마크 서비스를 전문으로 하는 사이트이다. 사용자들은 자신이 가 보았던 여러 웹 사이트를 북마크로 저장하고 태그를 달아 이 사이트를 통해 공유함으로써 다른 사용자들이 이를 통해 북마크 내용을 공유하게 하는 유용한 정보를 제공한다.
플리커 - 사용자들이 만든 사진을 웹에 올려 저장하고 공유할 수 있도록 하는 사진 공유 서비스이다. 사용자들이 자신의 사진을 올릴 때 태그를 입력하게 되는데 일반적인 방법으로는 검색이 힘들었던 사진 콘텐츠를 검색하기 쉽게 하였다.
위젯
태그 구름(Tag Cloud)- 태그를 이차원의 형태로 배치하고 텍스트를 인기도, 생성 시간 등에 따라 글꼴의 크기와 모양에 변화를 주어 표현하여 사용자가 유행하는 태그들에 자연스럽게 발견하여 접근할 수 있도록 하는 서비스이다. 보통 사이트의 홈페이지에 부분적으로 사용된다.
관련 태그 - 어떤 콘텐츠를 볼 때 이에 관련된 내용의 다른 콘텐츠를 연결하는 고리를 표시하기 위해 태그를 사용한다. 간접적인 연관성도 표시할 수 있다.
제품
아이팟(Apple iPod)- 애플 아이팟에서는 사용자가 파일의 속성안에 기록된 장르나 코멘트에 자신의 태그를 입력하고 이를 스마트 플레이 리스트에서 동적으로 선택하여 음악들을 정리할 수 있다. 이를테면, 어떤 음악을 '졸린 음악'으로 코멘트(Comment)로 정리하고 새로운 '잘때 듣는 음악'이라는 스마트 플레이 리스트를 만들고 그 조건에 '졸린 음악'을 넣으면 자동으로 이를 그룹으로 묶어줄 수 있으며 나중에 다른 음악을 '졸린 음악'으로 지정하면 자동으로 업데이트가 된다.
태그의 구분자
주로 영어권의 사이트들에서 태그와 다른 태그를 구분할 때에는 공백 문자(Blank, Space)를 사용하며 두 단어 이상이 하나의 태그를 형성하는 경우엔 따옴표(")를 구분자(Separator)로 사용하도록 하고 있다. 이는 입력이 쉽고 단어와 단어가 분명히 떨어져 있는 영어의 특성 때문이다. 한편, 한국의 사이트들에서는 이런 공백문자의 이용이 한글의 특성과 단어 사이의 공백을 넣는 것에 대한 혼란 때문에 쉼표(,)나 복수의 입력 필드를 사용하는 방법이 주로 이용되고 있다. 다만 띄어쓰기, 일부 특수 문자 등은 지원이 성립되지 못한다. 기존의 띄어쓰기로 되어 있는 표제어나 단락, 본문 같은 경우 사정없이 붙여쓰기를 해야 하며, 일부 특수문자인 앰퍼샌드 같은 기호는 00앤00 같은 이름을 대신하여 입력시켜야 한다.
해시태그, hashtag
인스타그램, 트위터 등 소셜 네트워크 서비스(SNS)에서 사용되는 메타데이터 태그로, 해시 기호(#) 뒤에 특정 단어를 쓰면 그 단어에 대한 글을 모아 분류해서 볼 수 있다.
소셜 네트워크 서비스나 마이크로블로그 서비스에서 관련된 내용물을 묶어주는 역할을 하는 태그이다. 사용자들이 관심 있는 주제의 내용물을 쉽게 찾을 수 있도록 도와준다. 보통 띄어쓰기 없이 단어나 문구를 쓰고 앞에 해시기호(#)를 붙여 넣는다. 이 해시태그를 클릭하면 해당 해시태그가 포함된 내용물이 모두 표시된다. 예를 들어 음식 사진을 올릴 때 #먹스타그램, 셀프 사진을 올릴 때 #셀카 이런 식으로 사용한다. 이러한 일상 속 키워드 뿐만 아니라 기업의 마케팅이나 테러의 피해자들을 위로하는 글처럼 사회적 이슈에도 사용된다.
본래 해시 기호(#)는 IT 업계에서 특별한 의미를 강조할 때 사용되었다. 예를 들어, 1978년에 C 프로그래밍 언어에서 먼저 처리되어야 할 키워드를 표시하기 위해 사용되었다. 당시에는 '해시 기호(hash symbol)'라고 불렸다. 그러다 2007년 트위터에서 수많은 정보들이 흩어지는 것을 안타깝게 여긴 사용자 '크리스 메시나(Chris Messena)'가 트위터 측에 "#을 써서 정보를 묶는 것을 어떻게 생각하냐"고 물었고 이를 트위터측이 받아들이면서 해시태그가 시작되었다. 그러나 트위터가 본격적으로 모든 해시태그에 하이퍼링크를 넣은 것은 2009년 7월의 일이다. 트위터는 2010년에 많이 언급된 해시태그를 뽑아 보여주는 '트렌딩 토픽'을 도입하기도 했다. 시작은 트위터였지만, 페이스북, 인스타그램 등 다른 소셜 네트워크 서비스에서도 같은 용도로 해시태그를 지원하고 있다.
널리 사용됨에 따라 옥스포드 영어사전은 2014년 6월 hashtag를 추가하였다. 해시태그라는 용어는 해시태그의 문맥에서 사용할 때 해시 심볼 그 자체를 가리킬 수도 있다.
해시태그 운동, Hashtag activism, 해시태그 활동주의
단순히 홍보 수단이나 가벼운 주제를 묶어 보여주는 역할에서 확대되어 정치·사회 이슈를 만들어내는 해시태그의 사회운동 역할을 말한다. 초기엔 놀이문화로만 이용되던 해시태그가 일종의 콘텐츠를 생산하는 역할을 맡았고, 사회운동 역할로 확장된 것이다. 해시태그를 중심으로 한 시민들의 용기 있는 고백이 모이고 모여 변화의 물꼬를 텄으며, 이게 오프라인으로 결집이 이어지면서 '집단 지성'으로써 힘을 증명한 것이다. 언론에 의해 형성된 여론 아니라 소셜 네트워크 서비스에 의해 시민들 스스로가 주도하는 여론이다.
메타데이터(metadata or metainformation)
데이터(data)에 대한 데이터이다. 이렇게 흔히들 간단히 정의하지만, 캐런 코일(Karen Coyle)에 의하면 '어떤 목적을 가지고 만들어진 데이터(constructed data with a purpose)'라고도 정의한다. 즉, 다른 데이터를 정의하고 기술하는 데이터(data that defines and describes other data)이다. 가령 도서관에서 사용하는 서지기술용으로 만든 것이 그 대표적인 예이다. 지금은 온톨로지의 등장과 함께 기계가 읽고 이해할 수 있는(Machine Actionable) 형태의 메타데이터가 많이 사용되고 있다. 설명 메타데이터, 구조화 메타 데이터로 구분된다.
역사
인류사에서 여러 가지 메타데이터가 등장한다. 그 첫째는 카드목록이다. 전혀 목록이 필요없다가 가나다순, 서명순, 저자명 순 등의 메타데이터가 필요했던 것이다. 그 다음은 데이비드 휠러(David Wheeler)가 말하는 간접수준(Level of Indirection)을 올리는 일이었다. 그는 컴퓨터 과학이 지금까지 한 공헌 중에서 가장 위대한 것이 있다면 바로 이 간접수준을 올렸다는 것이다. 바로 MARC와 같은 메타데이터이다. 그 다음이 팀 버너스리가 말하는 Machine Actionable Metadata이다. 기계는 전혀 모르는 flat한 메타데이터가 아니라, 기계가 스마트하게 알고 반응하는 메타데이터를 말한다. 텍스트의 바다요 아름다운 정원에 갇혀있는 엄청난 크기의 카탈로그의 문제를 Linked Data가 해결할 수 있는 모습을 보여주었고 이제는 웹 그 자체가 고질적으로 안고 있는 문제이다. 어쩌면 웹과 도서관이 서로 도와야 하는 부분이 이런 부분일 것이다.
개요
데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터이다. 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터이다. 어떤 데이터 즉 구조화된 정보를 분석, 분류하고 부가적 정보를 추가하기 위해 그 데이터 뒤에 함께 따라가는 정보를 말한다.
이를테면, 디지털 카메라에서는 사진을 찍어 기록할 때마다 카메라 자체의 정보와 촬영 당시의 시간, 노출, 플래시 사용 여부, 해상도, 사진 크기 등의 사진 정보를 화상 데이터와 같이 저장하게 되어 있다. 이러한 데이터를 분석하여 이용하면 그 뒤에 사진을 적절하게 정리하거나 다시 가공할 때에 아주 유용하게 쓸 수 있는 정보가 된다. GPS 기능을 사용하여 위치 정보까지 사진의 메타데이터에 입력할 수도 있는데, 이를 이용하면 사진이 어디에서 촬영되었는지를 쉽게 알 수 있고, 이로써 다시 다른 지역 정보를 검색하거나 같은 지역에서 찍은 다른 사진을 검색하게 하는 검색성을 향상시킬 수 있다.
메타데이터는 메타데이터가 부여될 때와 쓰일 때의 문맥 정보를 구조화시켜 그 활용도를 확대시키는 역할을 한다. 웹 2.0이나 온톨로지(Ontology)의 분야에서 구조화된 메타데이터는 매우 유용하다.
표준화
MARC(Machine Readable Cataloging, 기계가독목록) 메타데이터 형식을 대체하기 위해 1995년 3월 OCLC와 NCSA는 미국 오하이오 주의 더블린에서 첫 워크숍이 개최되었고, 더블린 코어라고 하는 메타데이터 형식을 만들었다. 이 형식은 단순화되었기 때문에 생성과 유지가 쉽고, 이해가 쉬우며, 국제적으로 인정되는 형식을 갖추도록 하였고, 확장성을 가질 수 있는 구조로 만들었다.
더블린 코어의 요소로는 제목, 만든이, 주제, 요약 정보 등 15가지 요소로 이루어진다. 덤다운(Dumb down) 원칙에 따라 상세화를 위해 쓰여진 한정어 때문에 오히려 그 뜻이 모호해지는 것을 막도록 한정 요소를 바꾸거나 빼고 상위 개념을 남겨두어 하위 개념을 같이 포함하도록 하는 단순화를 통해 안정적인 의미 전달을 하고자 한다.