728x90
반응형
SMALL

시맨틱웹(Semantic Web)

Linked Open Data (LOD) 에 대해서 이야기를 할려면 우선 Semantic Web에
대한 이해가 필요하다.
Semantic Web은 ‘의미론적 웹’으로 흔히 번역되는데, “Linked Open Data는 
Semantic Web을 실현시키기 위한 방법이자 기술적 접근점”으로 볼 수 있다.
웹(Web, World Wide Web)의 창시자인 팀 버너스 리(Tim Berners-Lee)는 
Semantic Web을 다음과 같이 정의하였다.
"시맨틱 웹은 현재 웹이 확장된 형태로, 잘 정의된 의미를 정보에 부여함으
로써 사람과 컴퓨터의 협업을 보다 원활하게 할 수 있도록 하는 것이다."
위 정의에서 알수있듯이 시맨틱웹이 기존 웹의 문제점을 보완하고자 만들어진
개념이 아니다. 단 현재의 웹(Web)은 사람이 읽고 활용할 수 있는 문서(document)
에 기반하고 있다는 점에서 그 한계가 있기 때문에 웹에 표현되어 있는
문서의 내용을 데이터베이스에 저장하듯이 어딘가 저장하고 이를 웹에서 활용
할수 있다면 사람이 아닌 기계가 자동적으로 처리하는 것이 가능하다는 것이다.


시맨팁웹의 실현을 위한 Linked Open Data

그러면 웹의 내용을 데이터베이스화 할려면 어떻게 해야 할까?
우선 웹에 개방되어 있는 데이터들의 의미와 활용범위 등을 명확히 해주는 즉, 웹에서
데이터가 상호운용성을 갖기 위해서는 웹에 기술된 데이터, 즉 객체(Object)가 
명확해야 한다.
즉 시맨틱 웹을 만들 수 있는 기술은 웹에 데이터를 저장하고 어휘집을 구축하며
데이터를 조작할 수 있는 규칙들을 만들 수 있도록 하는데, Linked Data의 핵심 기
술적 요소들인 RDF, SPARQL, OWL, SKOS가 이런 개념들을 실제로 구축가능하게
하는 요소들이다.
시맨틱웹을 구현하기 위한 유일한 방법이 Linked Open Data라고 이야기할
수는 없으나. 시맨틱 웹의 이상을 달성하기 위해 사람과 컴퓨터(기계)가 공통으로 
이해할 수 있는 구조화된 웹을 구현하기 위해 가장 활발하게 구축과 활용, 그리고 
연구개발이 이루어지고 있는 분야가 Linked Open Data인 것은 확실하다.
그래서 현재의 HTML 문서 중심의 웹을 ‘web of documents’로 표현하는 반면 
데이터 중심의 새로운 웹을 ‘web of data’라고 말한다.


Linked Open Data 의 플랫폼은 Web

Linked Open Data의 활용무대는 따로 플랫폼이 있는 것이 아니라 기존 Web 이다.
따라서 LOD를 만들기 위한 핵심적인 기술요소들은 이미 웹에서 일반적으로 활용되고 
있는 기술과 핵심 개념을 그대로 활용한다.
현재의 웹을 만들고 유지하고 있는 핵심 개념과 기술은 Hypertext, HTML, HTTP, URI
등이다. 


문서가 아닌 데이터를 표현하고 연결하기 위해서 LOD에서는 Hypertext, HTML
대신 새로운 표현방식과 연결방식을 활용한다. 흔히 RDF로 표현되는 새로운 정
보 표현방식과 상호연결(interlinking)이 그것이다.

위 <그림2> 를 보면 HTML로 작성된 문서가 포함하고 있는 특정 키워드가 관련된 또 다른
HTML문서로 연결되어 있는 모습을 보여주고 있다.
반면 데이터가 중심이 되는 웹에서는 아래와 같이 데이터가 연결된다.

언뜻 모양은 하나의 HTML 문서가 관련된 다른 HTML문서로 연결되는 모습과 유사하지만
그러나 LOD에서는 보다 중요하고 차별화된 점이 존재하는데. LOD는 완성된 HTML형태 
문서를 제공하는 것이 아니고 특정 개념(사실상 사람이 생각할수 있고 존재하는 모든 것)과 
이 개념이 갖는 특성(속성)을 구조적으로 제공하는 것이다. 따라서 모두가 이 데이터를 
이용하고 특히 기계가 처리하기 위해서는 엄격하고 명확한 정의가 필요합니다
<그림 3>에서와 같이 서울이라는 데이터를 설명하는 요소에는 ‘공식명칭’, ‘국가’, ‘관련산’ 
등이 존재한다. 이 요소들을 명확하게 하는 방법은 이 요소들이 의미하는 바를 명확하게 
하는 것이다 예를 들면 ‘공식명칭’이라는 요소는 ‘특정 개념을 대표할 수 있는 것으로 약어, 
속어 등을 사용하지 않고 법제도적으로 인증된 이름’으로 그 범위를 명확하게 하는 것이다 
또한, ‘서울’이라는 개념은 ‘도시’라는 개념에 속하는 것으로 위의 예시와 같이 ‘도시’라는 
개념이 의미하는 바가 무엇이고 어떤 영역에서 사용이 가능한 것인지를 상세하게 표현한 
설계서(온톨로지)를 참조한다.. 이렇게 해야지 문서의 내용을 데이터베이스화 할수 있고
이는 사람뿐만아니라 기계가 읽을수 있는 형태로 데이터가 구성될 수 있는 것이다.
이것이 바로 시맨틱웹의 구현 사상이다.

[출처]  알기 쉬운 Linked Open Data (발행처:한국정보화진흥원)
         정보관리기술사 118회 모임 - 두드림

728x90
반응형
LIST

+ Recent posts