Наука

Международный стандарт «Управление языковыми ресурсами – разделение слов в письменном тексте» и корейский язык

 2019.12.3.

В августе 2007 года 4-ая секция 37-ой технической комиссии Международной организации по стандартизации предложила определить «Управление языковыми ресурсами – разделение слов в письменном тексте» как международный стандарт, которое является одной из важных проблем в обработке языковых информаций.

«Управление языковыми ресурсами – разделение слов в письменном тексте»-предложенное 37-ой технической комиссией Международной организации по стандартизации, направлено на то, чтобы предупредить неправильную тенденцию разных разделений слов в разных языках мира и вести его единообразно и правильно.

4-ая секция 37-ой технической комиссии Международной организации по стандартизации отвечает за стандартизацию разделения слов в корейском, китайском, японском и других языках азиатских стран.

С августа 2007-ого по 2010-ый год преподаватели Университета 6 раз участвовали в работе определения международных стандартов ISO 24614-1:2010 "Language resource мanageмent-Word segмentation of written texts-Part 1: Basic concepts and general principles"(Управление языковыми ресурсами – разделение слов в письменном тексте – первая часть: базисные понятия и основные принципы) и ISO 24614-2:2011 "Language resource мanageмent-Word segмentation of written texts-Part 2: Word segмentation in Chinese, Japanese and Korean"(Управление языковыми ресурсами – разделение слов в письменном тексте –вторая часть: разделение слов в корейском, китайском и японском языках), в результате чего внесли вклад в его применение в масштабе всего мира с 2011-ого года.

Обложка Стандарта
Фото 1. Обложка Стандарта

Принят стандарт, отражающий отличие корейского языка как агглютинативного от флективных и изолирующих языков. Этот стандарт сможет играть роль образцового стандарта, так как он отражает особенности разнотипных языков мира. Благодаря этому установлена норма, гарантирующая обеспечение однообразности и взаимозаменяемости в разделении слов, а также обеспечение скорости и точности в обработке языковых информаций.

Этот стандарт будет применён для единообразного разделения слов в письменных текстах всех практических областей, способствующих обработке языковых информаций. К примеру, для обработки природного языка, включая корейский, китайский, японский, тайский, вьетнамский, монгольский и тибетский, для поиска информации, для поискового прибора, для консультации, для машинного перевода, для предварительной обработки синтеза звуков, для корректуры документов, для распознавания звуков и букв, для конечной обработки вводных методов букв, в электронной библиотеке, в семантических сетях, в электронном деле, в электронной торговле, в электронной учёбе и т. д.

Процесс принятия данного стандарта позволил корейскому языку с богатым лексическим составом и развитым грамматическим строем широко демонстрировать национальные особенности самого превосходного языка в мире и занять статус главного языка мира.

Доктор Пэ Гван Хи
Фото 2. Доктор Пэ Гван Хи обсуждает вопросы составления стандарта

В работе составления вышеуказанного стандарта участвовали Пэ Гван Хи - преподаватель кафедры корейского языка филологического факультета Университета имени Ким Ир Сена (доктор наук, доцент), Сон Му Сон-профессор факультета компьютерной науки Чинъхуаского университета Китая (профессор, доктор наук) и 4 знаменитых профессора и доктора азиатских стран.