Сообщить об ошибке на сайте
URL
Ошибка
Обучение машин

Эсанеддин Асгари и Хинрих Шутце из Университета Людвига-Максимилиана в Мюнхене (Германия) создали новый метод поиска ключевых элементов почти любого языка, который можно использовать как ступень к машинному переводу.

Новая технология основана на едином тексте, переведенном как минимум на 2000 различных языков — Библии. На основе этих переводов была составлена база данных — Parallel Bible Corpus. Ее недостаточно для промышленных машин вроде Google и других платформ, поэтому Асгари и Шутце придумали другой подход, основанный на способе выражения в различных языках одной грамматической категории — времени.

Большинство языков использует для обозначения времени особые слова или буквенные сочетания. Например, в креольском языке (относительно молодом и простом, поэтому ученые взяли его за образец), прошедшее время обозначается словом «ti». Выделив его и другие указатели на прошлое время в еще 10 языках, они начали поиск по параллельному своду текстов Библии, и обнаружили лингвистические конструкции, выполняющие те же функции в английским и немецком языках, а также в гораздо менее распространенных: в языке гурманчема востока Буркина-Фасо или ялунка, на котором говорят в Западной Африке.

Это позволило ученым создать карту, показывающую, как связаны языки, использующие схожие конструкции для передачи времени. Они разработали компьютерный метод, показывающий, как носители 1000 языков применяют настоящее, прошлое и будущее времена. Это крупнейшее межъязыковое исследование, известное науке.

Карта языковых времен позволяет лучше понять эволюцию языка. Этот же подход можно распространить и на другие лингвистические категории, что упрощает разработку средств машинного перевода на основе ИИ. Отсутствие возможности автоматически переводить на редкий язык ускоряет процесс вымирания языка. Такую тенденцию лингвисты уже наблюдали на примере телевидения: язык, на котором ведется вещание, становится более популярным.

Больше половины населения планеты говорит на пяти языках — английском, испанском, китайском, русском и хинди. На 100 языках говорят 95% жителей Земли. Остальным достались менее распространенные наречия, всего около 6900. На некоторых из них говорят менее 1000 человек, и они могут перейти в категорию мертвых в ближайшие сотню лет. Вместе с ними уйдет и их культурное наследие: уникальные истории, юмор, даже эмоции, пишет MIT Technology Review.

Машинный перевод работает только для единиц самых распространенных языков. Недавно к нейросети Google Translate, которая до того охватывала только 9 языков, присоединились еще три, в том числе — русский. Впрочем, по мнению некоторых исследователей, лет через 10 проблемы языкового барьера у людей не будет.

Загрузка...
Подписывайтесь на наши каналы в Telegram

«Хайтек» - новости онлайн по мере их появления

«Хайтек» Daily - подборки новостей 3 раза в день

Как европейский регламент по защите персональных данных GDPR повлияет на нашу жизнь
Тренды
Как развивается рынок умных домов в России и почему мы еще не живем в них
Умный дом
Падение астероида привело к потеплению на Земле. Оно продолжалось более 100 тыс. лет
Тренды
Киберспортсмен Данил Решетников — об изнуряющих тренировках, культовых играх и будущем киберспорта
Тренды
Астрономы создали проект «Горизонт событий», чтобы получить новые снимки черной дыры Стрелец А*
Частный космос
Alexa
Alexa от Amazon самостоятельно записала домашний разговор и отправила его другому человеку
Pornhub запустил свой VPN
Кейсы
Офис в VR, тесты от всех болезней и селфи с эмоциями: Эксперты рассказали, чего ждать в будущем от технологий
Технологический рывок
X5 Retail Group и Иннополис разработают магазин без продавцов
Иннополис
Мнения
Джейкоб Биамонте, Сколтех, — о том, что квантовые компьютеры могут уже сейчас
Плутон может оказаться скоплением более 1 млрд маленьких комет
Тренды
В американских солдат встроят датчики, рассказывающие о состоянии их здоровья
Тренды
Ученые прогнозируют снижение питательности риса из-за изменения климата. Рис едят миллиарды людей ежедневно
Тренды
Facebook представил искусственный интеллект, который превратит любой трек в симфонию
Тренды
Кейсы
Дачные ворота блогера самостоятельно подписались на платные услуги МТС
Южная Корея постепенно заменит солдат роботами
Тренды
IBM создала карманный детектор поддельных товаров
Кейсы
Чек-лист: как выбрать надежный магазин софта
Тренды
SpaceX запустила спутники, которые будут изучать гравитационное поле Земли
Тренды
Марк Цукерберг рассказал европейским парламентариям о работе Facebook
Утечка личных данных пользователей Facebook
В России могут запретить Booking.com
Блокировка интернета
Sony открыла предзаказ на «бесконечный блокнот» — планшет Digital Paper
Тренды
Мнения
Пять книг, которые Билл Гейтс рекомендует прочитать этим летом
8 лет назад программист купил две пиццы за 10000 биткоинов. Сейчас они стоят 83 миллиона долларов
Кейсы
Великобритания откроет центр для внедрения искусственного интеллекта в военную сферу
Тренды
Ученые придумали лекарство, которое предотвратит потерю памяти у космических путешественников
Тренды
Siri получит совершенно новый голос
Тренды
Вспышки сверхновых миллионы лет назад подтолкнули эволюцию на Земле
Как развивалась Вселенная
Лекарства из принтера и испытания на роботах: как новые технологии изменили фарму
Тренды
Тренды
Илон Маск предсказал возможное банкротство Tesla из-за дешевых Model 3
Российские ученые предлагают назвать следующий открытый элемент Антарктидием
Тренды
Microsoft и Google снова нашли массовую уязвимость в процессорах Intel
Хакеры
НАСА создаст в космосе температуру, ниже самой холодной во Вселенной
Тренды
Контейнеры, гибриды и туман: 5 трендов в облачных технологиях
Тренды
Facebook в 2019 году начнет вводить проект беспроводного интернета по всему миру
Технологический рывок
Роботы построили самый маленький дом в мире — размером с кончик волоса
Тренды
Идеи
Ученые выяснили, почему при высокой температуре запускается иммунитет и происходит выздоровление
Инвестор Виталий Голомб — об искусственном мясе и том, почему не нужно получать патенты
Тренды
Первая плавучая атомная электростанция «Ломоносов» завершила свой первый выход в море
Тренды
Посмотрите, как выглядит обожаемый всеми инженерами робот София
Доброжелательные роботы
Искусственные интеллекты тоже не смогли решить, что звучит на записи — «Янни» или «Лорел»
Искусственный интеллект
Астрономы нашли еще одно подтверждение наличия девятой планеты в Солнечной системе
Кейсы
Томские ученые представили сенсоры на основе органических молекул
Тренды
The Boring Company Илона Маска доставит огнеметы первым покупателям уже в начале лета
Кейсы
Инженеры собрали тактильного робота — его кожа может покрываться мурашками
Доброжелательные роботы
Билет в электробус The Boring Company Илона Маска будет стоить всего $1
Тренды
Тренды
Константин Носков возглавит новое министерство цифрового развития, связи и массовых коммуникаций
Китайские ученые создали из картона наноматериал для очищения воды от тяжелых металлов
Экология
Давид Ян запустил сервис «умной» корпоративной аналитики Yva
Кейсы