728x90
반응형
SMALL

1탄에서는 주로 시맨틱웹의 개념에 대해서 설명을 하였고 이 시맨틱웹 즉 Data of Web 을 구현하기 
위해 사용될 수 있는 기술인 Linked Open Data (LOD) 의 정의에 대해서 설명하였다.
이번 장에서는 Linked Open Data의 구성 기술 요소에 대해서 설명하고자 한다.

Lined Data 구축원칙

Tim Berners-Lee는 Lined Data의 구축 4원칙을 제시하였다. 

원칙 설명
URI 개체 식별을 위한 URI의 사용
LOD에서도 웹에서 특정 개체나 개념을 다른 것과 구분 짓고 고유하게 식별하기 위해서 
URI를 활용한다. 이는 기존 웹에서와 동일한 방식임.
ex) ● 서울의 URI : dbpedia.org/page/Seoul
     ● 컴퓨터의 URI : dbpedia.org/page/Computer
HTTP LOD에서도 마찬가지로 데이터에 대한 정보의 요청과 응답을 HTTP를 활용.
RDF RDF(S)는 URI나 HTTP 와 달리 기존 웹에서 사용하지 않던 기술요소임.
RDF는 쉽게 말하면 LOD에서 문서를 표현하는 방식이다.
데이터를 표현하기에는 기존 HTML 문서형식으로는 어렵다.
RDF (Resource Description Framework) 는 웹상에서 정보자원을 상세하기 표현하기 
위한 표현방식을 정의한 것으로 SPO 즉 주어 + 술어 + 목적어 로 이루어져 있다.    
SPARQL

Simple Protocal and RDF Query Language의 약자로, RDF 문서를 대상으로 필요한
정보를 조회(Query) 하기 위한 표준을 말한다.
SPARQL
Link 기존 웹에서 문서들이 하이퍼링크로 연결되어 정보의 확장성이 이루어진 것과 마찬가지로 데이터 웹인 LOD에서도 데이터 개체 간의 연결은 필수요소이다.



LOD 기술 요소 세부 설명

구분 LOD 기술요소 설명
Data 표현/식별
측면 기술 요소
URI 인터넷에 존재하는 각종 Data 객체의 명칭, 위치 등에 대한 표현법
XML 언어를 표현하는 언어 역할인 메타 언어(meta-language)의 기능
Namespace XML 문서에서 요소(element)나 속성(attribute)의 이름으로 쓰일 수 있는
이름 들의 집합 또는 표현 기준
Data 스키마 구현 
측면 기술 요소
RDF SVO(주어 + 동사 + 목적어)형태로 구현되는 정보 자원이나 Data
구조를 표현하는 언어
RDFS RDF의 Schema 정보로 경량의 온톨로지를 표현하는 기술
Data 변환 측면
기술 요소
R2RML RDB(데이터베이스)의 데이터를 RDF로 변환하는 기술
Machine
Understanding
측면 지원 기술 
요소
Ontology RDF Schema에 “분류”와 “논리적인 추론”을 부과하여 기계가 web의 의미를 해석하는 semantic web을 완성하도록 지원 하는 기술
OWL 속성과 클래스를 기술한 다양한 의미 표현 어휘를 제공하여 web
ontology를 지원하는 기계 해석 가능 언어
인프라 및
Application
측면 기술 요소
LOD Repository LOD 데이터를 저장하고 구조화 할 수 있도록 지원하는 인프라
SPARQL RDF 데이터에 대한 쿼리 언어를 정의, application 질의/응용 지원
시맨틱 웹 기술 LOD기반 기계 이해 지향형 차세대 웹 application 기술


[출처]  알기 쉬운 Linked Open Data (발행처:한국정보화진흥원)

         정보관리기술사 118회 모임 - 두드림

728x90
반응형
LIST
728x90
반응형
SMALL

시맨틱웹(Semantic Web)

Linked Open Data (LOD) 에 대해서 이야기를 할려면 우선 Semantic Web에
대한 이해가 필요하다.
Semantic Web은 ‘의미론적 웹’으로 흔히 번역되는데, “Linked Open Data는 
Semantic Web을 실현시키기 위한 방법이자 기술적 접근점”으로 볼 수 있다.
웹(Web, World Wide Web)의 창시자인 팀 버너스 리(Tim Berners-Lee)는 
Semantic Web을 다음과 같이 정의하였다.
"시맨틱 웹은 현재 웹이 확장된 형태로, 잘 정의된 의미를 정보에 부여함으
로써 사람과 컴퓨터의 협업을 보다 원활하게 할 수 있도록 하는 것이다."
위 정의에서 알수있듯이 시맨틱웹이 기존 웹의 문제점을 보완하고자 만들어진
개념이 아니다. 단 현재의 웹(Web)은 사람이 읽고 활용할 수 있는 문서(document)
에 기반하고 있다는 점에서 그 한계가 있기 때문에 웹에 표현되어 있는
문서의 내용을 데이터베이스에 저장하듯이 어딘가 저장하고 이를 웹에서 활용
할수 있다면 사람이 아닌 기계가 자동적으로 처리하는 것이 가능하다는 것이다.


시맨팁웹의 실현을 위한 Linked Open Data

그러면 웹의 내용을 데이터베이스화 할려면 어떻게 해야 할까?
우선 웹에 개방되어 있는 데이터들의 의미와 활용범위 등을 명확히 해주는 즉, 웹에서
데이터가 상호운용성을 갖기 위해서는 웹에 기술된 데이터, 즉 객체(Object)가 
명확해야 한다.
즉 시맨틱 웹을 만들 수 있는 기술은 웹에 데이터를 저장하고 어휘집을 구축하며
데이터를 조작할 수 있는 규칙들을 만들 수 있도록 하는데, Linked Data의 핵심 기
술적 요소들인 RDF, SPARQL, OWL, SKOS가 이런 개념들을 실제로 구축가능하게
하는 요소들이다.
시맨틱웹을 구현하기 위한 유일한 방법이 Linked Open Data라고 이야기할
수는 없으나. 시맨틱 웹의 이상을 달성하기 위해 사람과 컴퓨터(기계)가 공통으로 
이해할 수 있는 구조화된 웹을 구현하기 위해 가장 활발하게 구축과 활용, 그리고 
연구개발이 이루어지고 있는 분야가 Linked Open Data인 것은 확실하다.
그래서 현재의 HTML 문서 중심의 웹을 ‘web of documents’로 표현하는 반면 
데이터 중심의 새로운 웹을 ‘web of data’라고 말한다.


Linked Open Data 의 플랫폼은 Web

Linked Open Data의 활용무대는 따로 플랫폼이 있는 것이 아니라 기존 Web 이다.
따라서 LOD를 만들기 위한 핵심적인 기술요소들은 이미 웹에서 일반적으로 활용되고 
있는 기술과 핵심 개념을 그대로 활용한다.
현재의 웹을 만들고 유지하고 있는 핵심 개념과 기술은 Hypertext, HTML, HTTP, URI
등이다. 


문서가 아닌 데이터를 표현하고 연결하기 위해서 LOD에서는 Hypertext, HTML
대신 새로운 표현방식과 연결방식을 활용한다. 흔히 RDF로 표현되는 새로운 정
보 표현방식과 상호연결(interlinking)이 그것이다.

위 <그림2> 를 보면 HTML로 작성된 문서가 포함하고 있는 특정 키워드가 관련된 또 다른
HTML문서로 연결되어 있는 모습을 보여주고 있다.
반면 데이터가 중심이 되는 웹에서는 아래와 같이 데이터가 연결된다.

언뜻 모양은 하나의 HTML 문서가 관련된 다른 HTML문서로 연결되는 모습과 유사하지만
그러나 LOD에서는 보다 중요하고 차별화된 점이 존재하는데. LOD는 완성된 HTML형태 
문서를 제공하는 것이 아니고 특정 개념(사실상 사람이 생각할수 있고 존재하는 모든 것)과 
이 개념이 갖는 특성(속성)을 구조적으로 제공하는 것이다. 따라서 모두가 이 데이터를 
이용하고 특히 기계가 처리하기 위해서는 엄격하고 명확한 정의가 필요합니다
<그림 3>에서와 같이 서울이라는 데이터를 설명하는 요소에는 ‘공식명칭’, ‘국가’, ‘관련산’ 
등이 존재한다. 이 요소들을 명확하게 하는 방법은 이 요소들이 의미하는 바를 명확하게 
하는 것이다 예를 들면 ‘공식명칭’이라는 요소는 ‘특정 개념을 대표할 수 있는 것으로 약어, 
속어 등을 사용하지 않고 법제도적으로 인증된 이름’으로 그 범위를 명확하게 하는 것이다 
또한, ‘서울’이라는 개념은 ‘도시’라는 개념에 속하는 것으로 위의 예시와 같이 ‘도시’라는 
개념이 의미하는 바가 무엇이고 어떤 영역에서 사용이 가능한 것인지를 상세하게 표현한 
설계서(온톨로지)를 참조한다.. 이렇게 해야지 문서의 내용을 데이터베이스화 할수 있고
이는 사람뿐만아니라 기계가 읽을수 있는 형태로 데이터가 구성될 수 있는 것이다.
이것이 바로 시맨틱웹의 구현 사상이다.

[출처]  알기 쉬운 Linked Open Data (발행처:한국정보화진흥원)
         정보관리기술사 118회 모임 - 두드림

728x90
반응형
LIST

+ Recent posts