Сообщить об ошибке на сайте
URL
Ошибка
Обучение машин

Эсанеддин Асгари и Хинрих Шутце из Университета Людвига-Максимилиана в Мюнхене (Германия) создали новый метод поиска ключевых элементов почти любого языка, который можно использовать как ступень к машинному переводу.

Новая технология основана на едином тексте, переведенном как минимум на 2000 различных языков — Библии. На основе этих переводов была составлена база данных — Parallel Bible Corpus. Ее недостаточно для промышленных машин вроде Google и других платформ, поэтому Асгари и Шутце придумали другой подход, основанный на способе выражения в различных языках одной грамматической категории — времени.

Большинство языков использует для обозначения времени особые слова или буквенные сочетания. Например, в креольском языке (относительно молодом и простом, поэтому ученые взяли его за образец), прошедшее время обозначается словом «ti». Выделив его и другие указатели на прошлое время в еще 10 языках, они начали поиск по параллельному своду текстов Библии, и обнаружили лингвистические конструкции, выполняющие те же функции в английским и немецком языках, а также в гораздо менее распространенных: в языке гурманчема востока Буркина-Фасо или ялунка, на котором говорят в Западной Африке.

Это позволило ученым создать карту, показывающую, как связаны языки, использующие схожие конструкции для передачи времени. Они разработали компьютерный метод, показывающий, как носители 1000 языков применяют настоящее, прошлое и будущее времена. Это крупнейшее межъязыковое исследование, известное науке.

Карта языковых времен позволяет лучше понять эволюцию языка. Этот же подход можно распространить и на другие лингвистические категории, что упрощает разработку средств машинного перевода на основе ИИ. Отсутствие возможности автоматически переводить на редкий язык ускоряет процесс вымирания языка. Такую тенденцию лингвисты уже наблюдали на примере телевидения: язык, на котором ведется вещание, становится более популярным.

Больше половины населения планеты говорит на пяти языках — английском, испанском, китайском, русском и хинди. На 100 языках говорят 95% жителей Земли. Остальным достались менее распространенные наречия, всего около 6900. На некоторых из них говорят менее 1000 человек, и они могут перейти в категорию мертвых в ближайшие сотню лет. Вместе с ними уйдет и их культурное наследие: уникальные истории, юмор, даже эмоции, пишет MIT Technology Review.

Машинный перевод работает только для единиц самых распространенных языков. Недавно к нейросети Google Translate, которая до того охватывала только 9 языков, присоединились еще три, в том числе — русский. Впрочем, по мнению некоторых исследователей, лет через 10 проблемы языкового барьера у людей не будет.

Подписывайтесь на наши каналы в Telegram

«Хайтек» - новости онлайн по мере их появления

«Хайтек» Daily - подборки новостей 2 раза в день

перейдите по одной из ссылок и нажмите кнопку Join
Открыт новый класс химических реакций
Научные открытия
«Роботы уничтожат средний класс»
Мнения
«Дни двигателя внутреннего сгорания сочтены»
Транспорт будущего
Один день на крупнейшей в мире китайской биткойн-шахте
Криптовалюты
Образование
Несовершеннолетний биткойн-миллионер предложил реформу образования
К 2021 году в России будет использоваться 12,8 млн VR-шлемов
Мнения
ИИ научился видеть скрытые аналогии
Обучение машин
В России разработано оптоволокно с квадратной сердцевиной
Оптика
Тренды
Илон Маск и другие ИТ-лидеры требуют запретить военных роботов
«Блокчейн передаст власть над играми в руки геймеров»
Технологии игр
В Китае начал работу киберсуд по интернет-делам
Идеи
Система распознавания речи Microsoft установила новый рекорд
Распознавание речи
ИИ научился считывать намерения людей
Искусственный интеллект
Возобновляемая энергетика принесла экономике США до $113 млрд
Чистая энергетика
Facebook запатентует очки дополненной реальности
Тренды
NuTonomy запустит в Сингапуре сервис роботакси в 2018 году
Беспилотные автомобили
Южная Корея построит в Египте гигантскую умную ферму за $10 млрд
Тренды
Испытан первый в мире электрогенератор на океанических течениях
Возобновляемая энергетика
Мнения
«Алгоритмам нельзя внушить представление о справедливости»
Sony поможет новичкам разрабатывать ИИ
Искусственный интеллект
«ИИ будет двигателем четвертой технологической революции»
Кейсы
Стартап Made in Space напечатал радиационный щит прямо на борту МКС
Обитаемый космос
В 2018 году мировая солнечная энергетика прибавит 100 ГВт
Мнения
Термомагнитная стимуляция мозга заставила мышей двигаться против воли
Идеи
В Шотландии построят самую большую в регионе солнечную электростанцию
Солнечная энергетика
Глава Ford: «До полноценных робомобилей пока далеко»
Мнения
Идеи
Искусственная матка будет создана после 2020 года
Комиссия по ценным бумагам и биржам США будет регулировать ICO
Криптовалюты
Все, что нужно знать про биткойн
Тренды
Берлинский финтех-стартап помог европейцам инвестировать €4 млрд
Финансовые стартапы
Правительство Австралии установит контроль над обменниками криптовалют
Криптовалюты
Изобретена резина, которая не боится проколов
Новые материалы
Разработан метод стирания страшных воспоминаний
Идеи
Тайвань просит Tesla построить на острове хранилище энергии
Хранение энергии
Военные дроны
Оружейная компания установила на квадрокоптер пулемет
США установили рекорд по числу проданных роботов
Кейсы
Автомобили будущего
Toyota запатентовала невидимые боковые стойки
Солнечные стеклоблоки обещают революцию в строительстве
Идеи
В Казани пройдет IoT World Summit Russia 2017
Тренды
Hyundai представила водородный кроссовер нового поколения
Электромобили
Микроботы с антибиотиками вылечили желудочную инфекцию
Идеи
Nikola Motor займется солнечными панелями в подражание Tesla
Тренды
Fiat Chrysler вошел в консорциум по разработке робомобилей
Беспилотный транспорт
На орбите Земли появятся биткоин-спутники
Биткоины
Ричард Брэнсон: «Государства способны платить людям БОД»
Мнения
Китай отказался от строительства угольных электростанций на 150 ГВт
Кейсы
Идеи
Гидропонная ферма выращивает 54 тонны томатов в неделю
iPhone сможет проводить экскурсии в AR
Тренды
Разработчики приложений для Alexa начнут получать за них деньги
Кейсы
Pelecoin теперь позволяет майнить сразу несколько криптовалют
Криптовалюты
В Швейцарии начнут продавать бургеры из насекомых
Еда будущего
Электромотоциклы
Концерн «Калашников» представил электромотоцикл для полиции