Открытие в лингвистике позволит сохранить тысячи редких языков

Эсанеддин Асгари и Хинрих Шутце из Университета Людвига-Максимилиана в Мюнхене (Германия) создали новый метод поиска ключевых элементов почти любого языка, который можно использовать как ступень к машинному переводу.  

Новая технология основана на едином тексте, переведенном как минимум на 2000 различных языков — Библии. На основе этих переводов была составлена база данных — Parallel Bible Corpus. Ее недостаточно для промышленных машин вроде Google и других платформ, поэтому Асгари и Шутце придумали другой подход, основанный на способе выражения в различных языках одной грамматической категории — времени.

Большинство языков использует для обозначения времени особые слова или буквенные сочетания. Например, в креольском языке (относительно молодом и простом, поэтому ученые взяли его за образец), прошедшее время обозначается словом «ti». Выделив его и другие указатели на прошлое время в еще 10 языках, они начали поиск по параллельному своду текстов Библии, и обнаружили лингвистические конструкции, выполняющие те же функции в английским и немецком языках, а также в гораздо менее распространенных: в языке гурманчема востока Буркина-Фасо или ялунка, на котором говорят в Западной Африке.

Билур — новая криптовалюта с привязкой к нефти

Это позволило ученым создать карту, показывающую, как связаны языки, использующие схожие конструкции для передачи времени. Они разработали компьютерный метод, показывающий, как носители 1000 языков применяют настоящее, прошлое и будущее времена. Это крупнейшее межъязыковое исследование, известное науке.

Карта языковых времен позволяет лучше понять эволюцию языка. Этот же подход можно распространить и на другие лингвистические категории, что упрощает разработку средств машинного перевода на основе ИИ. Отсутствие возможности автоматически переводить на редкий язык ускоряет процесс вымирания языка. Такую тенденцию лингвисты уже наблюдали на примере телевидения: язык, на котором ведется вещание, становится более популярным.

Больше половины населения планеты говорит на пяти языках — английском, испанском, китайском, русском и хинди. На 100 языках говорят 95% жителей Земли. Остальным достались менее распространенные наречия, всего около 6900. На некоторых из них говорят менее 1000 человек, и они могут перейти в категорию мертвых в ближайшие сотню лет. Вместе с ними уйдет и их культурное наследие: уникальные истории, юмор, даже эмоции, пишет MIT Technology Review.

7 предсказаний Билла Гейтса, которые должны сбыться

Машинный перевод работает только для единиц самых распространенных языков. Недавно к нейросети Google Translate, которая до того охватывала только 9 языков, присоединились еще три, в том числе — русский. Впрочем, по мнению некоторых исследователей, лет через 10 проблемы языкового барьера у людей не будет.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
Ученые предостерегают от создания зеркальных бактерий: они угрожают жизни
Наука
Астрономы наблюдали редкий гамма-всплеск от черной дыры в соседней галактики
Космос
Физики нашли странную частицу: ее масса то возникает, то исчезает
Наука
Генетики выяснили, когда неандертальцы скрещивались с современными людьми
Наука
В Google оценили риски для криптографии с появлением квантового чипа Willow
Новости
На звездах, подобных Солнцу, супервспышки происходят чаще, чем считалось
Космос
Google Play закрывает монетизацию для разработчиков из России
Новости
НАСА установило причины «первой авиакатастрофы на Марсе»
Космос
Университетский стартап из Грозного разработал VR-тренажер для хоккеистов
Новости
Микророботы из гидрогеля уменьшили раковые опухоли у мышей
Наука
Форум по робототехнике для школьников и студентов пройдет в Иннополисе
Иннополис
В пещере «первых Homo sapience Евразии» обнаружили ритуальную комнату
Наука
Эксперты обсудили путь от замещения импорта к технологическому лидерству
Наука
В ранней Вселенной нашли галактику, напоминающую юный Млечный Путь
Космос
Материал с МКС лучше земных аналогов активирует восстановление костей
Космос
Болото вместо степи: выяснили, каким был мост между Евразией и Америкой
Наука
Горбатый кит в поисках партнера пересек три океана и проплыл 13 000 км
Наука
Химики создали суперустойчивые кишечные палочки для промышленности
Наука
В IBM придумали как в пять раз быстрее обучать ИИ и экономить энергию
Новости
«Т-Технологии» бесплатно предоставит разработчикам российские модели ИИ
Новости