Сообщить об ошибке на сайте
URL
Ошибка
Обучение машин

Эсанеддин Асгари и Хинрих Шутце из Университета Людвига-Максимилиана в Мюнхене (Германия) создали новый метод поиска ключевых элементов почти любого языка, который можно использовать как ступень к машинному переводу.

Новая технология основана на едином тексте, переведенном как минимум на 2000 различных языков — Библии. На основе этих переводов была составлена база данных — Parallel Bible Corpus. Ее недостаточно для промышленных машин вроде Google и других платформ, поэтому Асгари и Шутце придумали другой подход, основанный на способе выражения в различных языках одной грамматической категории — времени.

Большинство языков использует для обозначения времени особые слова или буквенные сочетания. Например, в креольском языке (относительно молодом и простом, поэтому ученые взяли его за образец), прошедшее время обозначается словом «ti». Выделив его и другие указатели на прошлое время в еще 10 языках, они начали поиск по параллельному своду текстов Библии, и обнаружили лингвистические конструкции, выполняющие те же функции в английским и немецком языках, а также в гораздо менее распространенных: в языке гурманчема востока Буркина-Фасо или ялунка, на котором говорят в Западной Африке.

Это позволило ученым создать карту, показывающую, как связаны языки, использующие схожие конструкции для передачи времени. Они разработали компьютерный метод, показывающий, как носители 1000 языков применяют настоящее, прошлое и будущее времена. Это крупнейшее межъязыковое исследование, известное науке.

Карта языковых времен позволяет лучше понять эволюцию языка. Этот же подход можно распространить и на другие лингвистические категории, что упрощает разработку средств машинного перевода на основе ИИ. Отсутствие возможности автоматически переводить на редкий язык ускоряет процесс вымирания языка. Такую тенденцию лингвисты уже наблюдали на примере телевидения: язык, на котором ведется вещание, становится более популярным.

Больше половины населения планеты говорит на пяти языках — английском, испанском, китайском, русском и хинди. На 100 языках говорят 95% жителей Земли. Остальным достались менее распространенные наречия, всего около 6900. На некоторых из них говорят менее 1000 человек, и они могут перейти в категорию мертвых в ближайшие сотню лет. Вместе с ними уйдет и их культурное наследие: уникальные истории, юмор, даже эмоции, пишет MIT Technology Review.

Машинный перевод работает только для единиц самых распространенных языков. Недавно к нейросети Google Translate, которая до того охватывала только 9 языков, присоединились еще три, в том числе — русский. Впрочем, по мнению некоторых исследователей, лет через 10 проблемы языкового барьера у людей не будет.

Подписывайтесь на наши каналы в Telegram

«Хайтек» - новости онлайн по мере их появления

«Хайтек» Daily - подборки новостей 3 раза в день

перейдите по одной из ссылок и нажмите кнопку Join
Mercedes представила электрический коммерческий минивэн
Кейсы
Интернет для всех
В США отменят сетевой нейтралитет 14 декабря
В Швейцарии введут единую систему онлайн-идентификации
Электронная идентификация
Looking Glass представил устройство для взаимодействия с голограммами
Голограммы
ЭКГ поможет точно диагностировать депрессию и биполярное расстройство
Медицина будущего
Блокчейн может сэкономить крупным супермаркетам миллиарды долларов
Блокчейн
На Fiverr составляют проспекты эмиссии для ICO за $100
ICO
В МТИ спрогнозировали счастье с точностью 94%
Большие данные
Три способа повысить эффективность концентрированной солнечной энергии
Чистая энергия
Электромобили
Мировые продажи электромобилей выросли на 63%
Японская деревня проведет ICO для оживления экономики
ICO
После ICO компании пропадают или теряют деньги
ICO
В 2018 году Госдума рассмотрит конвенцию о робототехнике и ИИ
Кейсы
Коктейль из трех лекарств поможет лечить болезнь Альцгеймера
Медицина будущего
5 прогнозов для транспортной отрасли на 2018 год
Прогнозы
Ученые научились преобразовывать выбросы CO2 в топливо
Тренды
Интернет вещей поможет повысить урожай
Интернет вещей
В ожидании конца света американцы запасаются биткойнами
Криптовалюты
Электротранспорт
Глава Toyota: «Tesla нам не враг, но и не образец для подражания»
«У стартапов, создающих мозги для ИИ, всего один шанс на успех»
Искусственный интеллект
МГУ попал в Топ вузов с высоким уровнем трудоустройства выпускников
Тренды
В Британии одобрили лекарство, которое замедляет развитие рака груди
Тренды
5 компаний, которые меняют подход к блокчейну
Блокчейн
Искусственный интеллект
Китай будет выпускать ИИ-чипы, которые в 20 раз эффективнее NVIDIA
Промышленные роботы становятся эффективнее человека
Рынок труда
Обнаружена связь между высоким IQ и успешностью в видеоиграх
Видеоигры
Новый способ магнитной записи данных позволит создать нейронные сети
Идеи
«Летающее такси» SureFly совершит первый полет в январе 2018
Летающие такси
Lauva представила электробайки со спрятанной в раму электроникой
Электровелосипеды
Alibaba покупает треть крупнейшей сети супермаркетов Китая
Кейсы
Рынок систем хранения энергии удвоится 6 раз до 2030 года
Тренды
Алгоритм AISense позволит вспомнить все разговоры
Обучение машин
McKinsey: «Персонализация — это не то, что вы думаете»
Цифровой маркетинг
Индия хочет решить проблемы с недвижимостью через блокчейн
Блокчейн
Искусственный интеллект
ИИ распознает поддельную картину по одному мазку кисти
Новая технология позволит биологам заглянуть в самый центр хромосомы
Биомедицина
Маск: «Ракетные технологии дадут Roadster революционные возможности»
Мнения
IEEE представил три новых закона робототехники
Робоэтика
Новое устройство одновременно производит электроэнергию и водород
Идеи
При переходе на чистую энергию Siemens сократит 7000 рабочих мест
Чистая энергия
Uber купит у Volvo 24 тысячи XC90 и сделает их беспилотными
Беспилотный транспорт
Рейтинг лучших
25 главных изобретений 2017 года
Tencent: первая китайская компания с капитализацией свыше $500 млрд
IT-гиганты
На смену лекарствам могут прийти световые импульсы
Медицина будущего
Британия вложит £20 млн в привлечение молодежи в кибербезопасность
Образование
В новых моделях iPhone, возможно, будут 5G-модемы от Intel
Переход на 5G
Еда будущего
Банки продовольствия переходят на вертикальные фермы
Носимые фитнес-трекеры Spire не требуют подзарядки
Гаджеты
Новый HUD-дисплей для Lincoln — еще один шаг к дополненной реальности
Транспорт будущего