전체메뉴

전체메뉴 닫기

분야별 검색

  • Home
  • 기록물 열람
  • 통합검색
  • 분야별 검색

문화체육관광

21C세종계획

주제유형
하위주제
  • 집필 내용은 국가기록원의 공식입장과 다를 수 있습니다.
주제설명
근거

21세기 정보화 사회에서는 정보가 곧 경쟁력을 의미한다. 따라서, 정보화 사회에서 국민 전체의 언어·문화생활을 향상시키고 과학 기술 및 학문을 발전시키기 위해서는 대규모 언어 자료를 축적하고 그것을 정보·지식으로 가공하는 일이 중요하다. 이러한 인식 하에 여러 선진국들은 자국어를 중심으로 한 언어 자원 확충과 정보화를 위해 여러 가지 계획을 추진 중에 있다. 이러한 상황에서 우리의 언어·문화 발전을 기하고, 세계적인 정보화 추세에 적극 대응하며, 문화산업 및 정보산업 역량을 육성하기 위해서는 중장기적 설계의 국어 정보화 사업의 추진이 필요하다.〈21세기 세종계획〉은 위와 같은 인식 하에 우리나라의 선진 정보 문화를 자주적으로 구현하기 위해 국가 정책적으로 시행되는 국어정보화 중장기 사업으로 10년 간(1998년∼2007년)의 계획으로 추진되었다.

배경

2007년까지 언어 정보 문화의 기본 바탕과 자원을 확충하기 위한 국어 정보화 중장기 발전 계획의 일환으로 수립되었으며, 그 명칭은 국어 정보화의 기본 바탕이라 할 수 있는 훈민정음을 창제한 세종대왕의 왕명에서 따온 것이다. 우리나라의 선진 정보 문화를 자주적으로 구현할 수 있는 국어 정보화 중장기 발전 계획의 수립을 그 목적으로 한다. 한국어로 세계의 모든 문화 정보를 처리할 수 있는 고도의 기술을 개발하고 이를 세계화하는 일이 곧 우리나라가 국가간의 정보화 경쟁에서 주도권을 확보할 수 있는 길이며, 또한 이것이 선진 정보 문화를 자주적으로 실현하는 길이다. 이를 위하여, 10년간(1998∼2007)의 단계적 발전 계획을 수립하고, 어문 정책·언어 정보화 처리 기술·어문 생활 등을 선도한다. 아울러 한글을 세계화 하고 그 우수성을 널리 알리는 데에도 적극 기여한다.

경과

1998년의 결과물은 기초자료 구축분과에서 현대국어 말뭉치 1,650만 어절, 세종 균형 말뭉치 1,000만 어절을 정리하였으며 말뭉치 활용 도구 H2B.EXE, H2K.EXE, WDcount.EXE, WDC_TEI.EXE, CWORD.EXE, Jamo.EXE, Hsort_H.exe, Correct.EXE, Chk_TEI.exe 등을 구축하였다. 그리고 북한 및 해외 한국어 말뭉치 135만 어절, 역사 자료 말뭉치 70만 어절, 구비 문학 말뭉치 100만 어절정리 및 범용 용례 추출기(글잡이 1.0)개발을 이룩하였다. 한민족 언어 정보화 분과에서는 한글 맞춤법 검색 시스템, 남북한 언어 비교 사전을 개발하였고 전자사전 개발분과에서는 사전 구축 지침서, 전자사전 표본, 작성 예정 목록 등을 작성하였다. 글꼴 개발·보급 센터에서는 글꼴 관련 연구 논저 목록, 옛한글 문헌 자료 목록, 한글 자형 변천사 등을 정리하였고 전문용어센터에서는 전문 용어 데이터베이스, 다국어 대응 전문 용어 데이터베이스, 경제 분야와 관련된 시범 표준안 100여 건을 만들어냈다. 


1999년에는 기초 자료 구축 분과에서 현대국어 문어 말뭉치 1,600만 어절, 형태소 분석 말뭉치 150만 어절, 현대국어 구어 전사 말뭉치 50만 어절, 북한 및 해외 한국어 말뭉치 130만 어절, 국어사 자료 말뭉치 75만 어절, 구비문학 말뭉치 130만 어절, 한영 병렬 말뭉치 25만 어절을 정리하였다. 그리고 한민족 언어 정보화 분과에서 남북한 언어 비교 사전, 어문규정 검색 자료, 어문규범 통합 검색 프로그램 등을 개발하였다. 전자 사전 개발 분과에서는 체언 전자 사전 1수준 정보 20,000 어휘, 상세 정보 1,652 어휘, 용언 전자 사전 1수준 정보 20,000 어휘, 상세 정보 1,552 어휘, 복합어 전자 사전 1수준 정보 20,000 어휘, 상세 정보 2,928 어휘, 고유 명사 전자 사전 1수준 정보 50,000 어휘, 상세 정보 10,300 어휘, 조사·어미 전자 사전 표본 기술 150 어휘, 통합 전자 사전 1수준 정보 110,000 어휘, 상세 정보 16,552 어휘를 구축하였다. 글꼴 개발·보급 센터에서는 문화 바탕체 11,172자, 한글 정자 쓰기체 글자본, 한글 흘림 쓰기체 글자본을 만들었으며 전문용어센터에서는 전문 용어 목록 데이터베이스 물리 분야 1만여 어휘, 물리학 전문 용어 3개국 대역 목록(한·영·일 3만 건), 물리 용어 조어법 분석 목록, 물리 용어 심의 분석 목록 300 어휘, 물리학 분야 동사 구조화 문형 100건, 물리 용어 구조화를 위한 동사 빈도 조사 목록, 경제 용어 조어법 분석 목록, 경제 용어 심의 분석 목록 1,000 어휘, 경제 용어 어휘 기술 목록 100 어휘를 정리하였다. 비표준 문자 등록 센터에서는 한자 정보 데이터베이스, 한자 정보 데이터베이스 검색용 소프트웨어(CNS.EXE), 한자 데이터베이스 코드북, 옛한글 음절 문자 빈도순 총목록 총 5,291자를 구축하였다. 


2000년에는 기초자료 분과에서 현대 국어 기초 말뭉치 800만 어절, 형태 분석 말뭉치 200만 어절, 현대 국어 균형 말뭉치, 말뭉치 통합 응용 시스템(글잡이II : 글잡이II(직접), 글잡이II(색인), 지능형 형태소 분석기, 두글잡이 병렬 말뭉치 사용 도구)을 구축하였고 특수자료분과에서 구어 전사 자료 말뭉치 50만 어절, 북한 및 해외 한국어 말뭉치 130만 어절, 언해 및 한글 역사 자료 말뭉치 100만 어절, 한영 병렬 말뭉치 75만 어절을 정리하였다. 한민족 언어 정보화 분과에서 남북한 언어 비교 검색 사전 시스템, 어문 규정 검색 통합 시스템을 구축하였고 전자사전 분과에서 체언 전자 사전(단일어 : 상세 기술 2,045 어휘, 확장 목록 20,192 어휘, 의존 명사 대명사 수사 : 상세 기술 411 어휘, 확장 목록 1,277 어휘, 복합어 : 상세 기술 500 어휘, 확장 목록 20,118 어휘, 어근·접사 : 상세 기술 100 어휘, 확장 목록 1,501 어휘), 용언 전자 사전(상세 기술 2,008 어휘, 확장 목록 5,603 어휘), 부사 전자 사전(상세 기술 103 어휘, 확장 목록 5,107 어휘), 조사 어미 관형사 전자 사전(상세 기술 838 어휘, 확장 목록 2,370 어휘), 고유 명사 전자 사전(상세 기술 13,403 어휘, 확장 목록 57,804 어휘), 통합 전자 사전(상세 기술 19,398 어휘, 형태 및 범주 정보 부착 94,309 어휘)를 정리하였고 글꼴 개발 보급 센터에서 글꼴 관련 연구 논저 목록, 한글 글꼴 개발 목록 165종 구축 및 글꼴 공모전을 개최하였고 전문 용어 센터에서 한·영·일 3개국 대응 물리 용어 목록 및 화학 분야 전문 용어 기초 자료 데이터베이스 100만 어절을 구축하는 성과를 이루어냈다.

내용

〈21세기 세종계획〉의 세부목표는 우리말과 우리글을 바탕으로 하는 정보사회 건설, 세계 수준의 국어 기초 언어 자료 기반 구축을 통한 우리말 정보화, 표준화된 전자 사전 구축을 통한 우리말 체계화, 한민족 언어 정보화를 통한 우리말 세계화, 언어 정보화 관련 규격 및 도구의 체계적 정리를 통한 우리말 표준화 이상의 5가지를 계획의 목표로 하고 있다. 


사업추진기관은 문화체육관광부이며 사업주관 기관은 국립 국어연구원으로 국어기초자료구축분과, 국어 특수자료 구축분과, 한민족 언어 정보화 분과, 전자 사전개발분과 등 총9개의 분과로 구성되어 있으며 구체적인 사업 내용은 다음과 같다.


국어 기초 자료 구축 분과는 원시·형태 분석·구문 분석·의미 분석 등의 말뭉치 구축 및 말뭉치 활용 도구 개발을 담당하고, 국어 특수 자료 구축 분과는 구어·병렬·역사 자료·북한 및 해외 등의 말뭉치 구축 및 각종 말뭉치 검색 시스템을 개발한다. 한민족 언어 정보화 분과는 남북한 언어 비교 사전, 어문 규정 검색 시스템, 한국 방언 검색 시스템, 한민족 언어 정보화 통합 프로그램 개발을 담당하고, 전자 사전 개발 분과는 언어 정보 처리에 가장 필요하고 보편적으로 사용할 수 있는 전자 사전을 구축한다. 국어 정보화 연구 인력 양성 분과는 국어 정보화 아카데미 개최 및 관련 교재를 개발하고, 전문 용어 표준화 분과는 전문 용어 개발 환경 조성·전문 용어 표준화·전문 용어 데이터베이스를 구축한다. 비표준 문자 등록 센터는 한자 정보 데이터베이스, 옛한글 정보 데이터베이스 등 구축하고, 글꼴 개발·보급 센터는 글꼴 현황 보고서·글꼴 용어 사전 발간 및 인터넷을 통한 글꼴 정보를 제공한다. 마지막으로〈21세기 세종계획〉결과물 보급·관리 센터는 국어 정보화 종합 정보실 및 21세기 세종계획 홈페이지 관리를 맡고 있다. 


이러한 국어 정보화 작업은 컴퓨터와 의사소통을 하기 위해서는 컴퓨터에 인간의 언어 능력과 유사한 능력을 부여해 주어야 하고, 컴퓨터가 이해할 수 있는 형태로 언어 정보를 제공해 주어야만 한다. 따라서 컴퓨터가 언어 능력을 갖도록 하기 위해서는 언어의 모든 규칙을 제공하여 주고, 이것을 컴퓨터에서 활용할 수 있도록 하는 제반 작업이 선행되어야 한다. 즉, 인간의 언어 이해와 생성 능력을 컴퓨터에 이식시키려면 대규모의 자료 및 정보(단어, 지식, 문법 체계 등)와 그것들의 정련 단계, 그리고 다양한 언어 현상을 컴퓨터 관련 기술에 반영 하는 과정 등이 필요하다. 결국 국어 정보화란 대규모의 국어 자료와 정보를 구축한 후 이를 바탕으로 컴퓨터가 언어 처리 능력을 가질 수 있게 하고, 이 기술을 21세기 새로운 정보 산업의 총아로 각광받고 있는 자동 번역, 음성 인식 시스템 등의 언어 정보 산업에 응용하는 전 과정을 의미한다. 한편 21세기 지식 정보 사회에서는 정보화 되지 않은 언어는 그 미래를 장담할 수 없으며, 우리만의 정보화를 우리 스스로 이룩해야 한다. 


민족의 혼이라고 할 수 있는 한국어와 이의 표기 수단인 한글을 보전하고 발전시키며, 이를 국제화하고 세계화하기 위해서는 한국어로 된 많은 정보를 전 세계인과 우리 국민들에게 제공하고, 영어 등으로 된 선진국들의 정보를 한글로 전환시켜 주는 각종의 정보화 사업이 필요한데 바로 여기에 국어 정보화의 중요성이 있는 것이다.

참고자료

21세기 세종계획 (http://www.sejong.or.kr)

집필자
한범수(경기대학교 관광개발학과 교수)
최초 주제 집필
2006. 12. 01
최초 주제 수정
2014. 02. 20