Открытие в лингвистике позволит сохранить тысячи редких языков

Эсанеддин Асгари и Хинрих Шутце из Университета Людвига-Максимилиана в Мюнхене (Германия) создали новый метод поиска ключевых элементов почти любого языка, который можно использовать как ступень к машинному переводу.  

Новая технология основана на едином тексте, переведенном как минимум на 2000 различных языков — Библии. На основе этих переводов была составлена база данных — Parallel Bible Corpus. Ее недостаточно для промышленных машин вроде Google и других платформ, поэтому Асгари и Шутце придумали другой подход, основанный на способе выражения в различных языках одной грамматической категории — времени.

Большинство языков использует для обозначения времени особые слова или буквенные сочетания. Например, в креольском языке (относительно молодом и простом, поэтому ученые взяли его за образец), прошедшее время обозначается словом «ti». Выделив его и другие указатели на прошлое время в еще 10 языках, они начали поиск по параллельному своду текстов Библии, и обнаружили лингвистические конструкции, выполняющие те же функции в английским и немецком языках, а также в гораздо менее распространенных: в языке гурманчема востока Буркина-Фасо или ялунка, на котором говорят в Западной Африке.

Билур — новая криптовалюта с привязкой к нефти

Это позволило ученым создать карту, показывающую, как связаны языки, использующие схожие конструкции для передачи времени. Они разработали компьютерный метод, показывающий, как носители 1000 языков применяют настоящее, прошлое и будущее времена. Это крупнейшее межъязыковое исследование, известное науке.

Карта языковых времен позволяет лучше понять эволюцию языка. Этот же подход можно распространить и на другие лингвистические категории, что упрощает разработку средств машинного перевода на основе ИИ. Отсутствие возможности автоматически переводить на редкий язык ускоряет процесс вымирания языка. Такую тенденцию лингвисты уже наблюдали на примере телевидения: язык, на котором ведется вещание, становится более популярным.

Больше половины населения планеты говорит на пяти языках — английском, испанском, китайском, русском и хинди. На 100 языках говорят 95% жителей Земли. Остальным достались менее распространенные наречия, всего около 6900. На некоторых из них говорят менее 1000 человек, и они могут перейти в категорию мертвых в ближайшие сотню лет. Вместе с ними уйдет и их культурное наследие: уникальные истории, юмор, даже эмоции, пишет MIT Technology Review.

7 предсказаний Билла Гейтса, которые должны сбыться

Машинный перевод работает только для единиц самых распространенных языков. Недавно к нейросети Google Translate, которая до того охватывала только 9 языков, присоединились еще три, в том числе — русский. Впрочем, по мнению некоторых исследователей, лет через 10 проблемы языкового барьера у людей не будет.

Подписывайтесь
на наши каналы в Telegram

«Хайтек»новостионлайн

«Хайтек»Dailyновости 3 раза в день

Первая полоса
На спутнике Сатурна обнаружили аномалию: реки Титана не образуют дельт
Космос
Марсоход обнаружил крупные углеродные отложения на Марсе
Космос
Посмотрите на детальные 3D-модели остатков от взрывов сверхновых
Космос
Крошечные спутники НАСА наблюдали солнечную корону и солнечный ветер
Космос
Хирурги провели пересадку, при которой сердце не переставало биться
Наука
Найдены странные материалы, которые нарушают законы термодинамики
Наука
VR-приложение для снижения тревожности сделали студенты из Чечни
Наука
1 Гб за 3 секунды: китайцы представили флеш-память, которая быстрее оперативки
Новости
Уничтожать нельзя оставить: в России придумали, что делать с борщевиком
Наука
На этой планете нашли признаки жизни: теперь мы знаем, как она выглядит
Космос
Мошенники стали использовать символы Пасхи в схемах в Telegram: как защитить себя
Новости
Китай вывел на максимум экспериментальный ториевый реактор: США это не удалось
Наука
Discord вводит проверку пользователей с помощью биометрии: как это будет работать
Новости
«Солнцезащитный крем» и одежда могли помочь Homo sapiens пережить неандертальцев
Наука
Эта частица раскроет тайну невидимой Вселенной: физики впервые создали ее аналог 
Космос
Климатические аномалии помогли варварам завоевать римскую Британию
Наука
Ответ найден: как крокодилам удалось пережить два массовых вымирания
Наука
Оказалось, кошки не такие уж древние, как все считали
Наука
Терапия стволовыми клетками уменьшила тремор у пациентов с Паркинсоном
Наука
Неуловимый гигантский кальмар впервые попал на видео в естественной среде
Наука