Сообщить об ошибке на сайте
URL
Ошибка
Обучение машин

Эсанеддин Асгари и Хинрих Шутце из Университета Людвига-Максимилиана в Мюнхене (Германия) создали новый метод поиска ключевых элементов почти любого языка, который можно использовать как ступень к машинному переводу.

Новая технология основана на едином тексте, переведенном как минимум на 2000 различных языков — Библии. На основе этих переводов была составлена база данных — Parallel Bible Corpus. Ее недостаточно для промышленных машин вроде Google и других платформ, поэтому Асгари и Шутце придумали другой подход, основанный на способе выражения в различных языках одной грамматической категории — времени.

Большинство языков использует для обозначения времени особые слова или буквенные сочетания. Например, в креольском языке (относительно молодом и простом, поэтому ученые взяли его за образец), прошедшее время обозначается словом «ti». Выделив его и другие указатели на прошлое время в еще 10 языках, они начали поиск по параллельному своду текстов Библии, и обнаружили лингвистические конструкции, выполняющие те же функции в английским и немецком языках, а также в гораздо менее распространенных: в языке гурманчема востока Буркина-Фасо или ялунка, на котором говорят в Западной Африке.

Это позволило ученым создать карту, показывающую, как связаны языки, использующие схожие конструкции для передачи времени. Они разработали компьютерный метод, показывающий, как носители 1000 языков применяют настоящее, прошлое и будущее времена. Это крупнейшее межъязыковое исследование, известное науке.

Карта языковых времен позволяет лучше понять эволюцию языка. Этот же подход можно распространить и на другие лингвистические категории, что упрощает разработку средств машинного перевода на основе ИИ. Отсутствие возможности автоматически переводить на редкий язык ускоряет процесс вымирания языка. Такую тенденцию лингвисты уже наблюдали на примере телевидения: язык, на котором ведется вещание, становится более популярным.

Больше половины населения планеты говорит на пяти языках — английском, испанском, китайском, русском и хинди. На 100 языках говорят 95% жителей Земли. Остальным достались менее распространенные наречия, всего около 6900. На некоторых из них говорят менее 1000 человек, и они могут перейти в категорию мертвых в ближайшие сотню лет. Вместе с ними уйдет и их культурное наследие: уникальные истории, юмор, даже эмоции, пишет MIT Technology Review.

Машинный перевод работает только для единиц самых распространенных языков. Недавно к нейросети Google Translate, которая до того охватывала только 9 языков, присоединились еще три, в том числе — русский. Впрочем, по мнению некоторых исследователей, лет через 10 проблемы языкового барьера у людей не будет.

Подписывайтесь на наши каналы в Telegram

«Хайтек» - новости онлайн по мере их появления

«Хайтек» Daily - подборки новостей 3 раза в день

Black Rock предсказывает будущее экономики с помощью больших данных
Идеи
Из стволовых клеток создали вакцину против рака
Борьба с раком
Австралийский биохакер будет защищать права киборгов в суде
Биохакинг
Британская организация предлагает ввести БОД для рабочих
Соцпособия будущего
Идеи
Графеновый фильтр в один шаг очистил воду из Сиднейской бухты
ОАЭ планируют отправить первую миссию на Марс в 2020 году
Космос
«Яндекс» испытал беспилотный автомобиль на улицах Москвы
Кейсы
«Стволовые клетки — это загрузочный диск вашего организма»
Борьба со старением
CRISPR применят для диагностики
Тренды
В Австралии запустили крупнейшую в стране плавучую солнечную станцию
Солнечная энергетика
Новая 3D-биопечать создает естественную среду для развития тканей
Биотехнологии
Квантовые компьютеры
Intel создала квантовый компьютер в два кубита на кремниевом чипе
В Дубае прошли испытания первых в мире автономных кабин
Автономный транспорт
Eviation обещает выпустить электросамолет к 2021 году
Идеи
Новый вид иммунотерапии поможет справиться с вирусом гриппа
Медицина
К 2020 году Boeing будет выпускать по самолету каждые 10 часов
Кейсы
Генное редактирование поможет бороться с умственной отсталостью
Биотехнологии
Starfighters подготовит первых космических туристов к полетам
Частный космос
Услуги блокчейн-консалтинга на Западе и в России
Блокчейн
Кейсы
Чикаго и Кливленд может соединить линия Hyperloop
Термальный резонатор получает энергию из колебаний температуры воздуха
Чистая энергия
ИИ научился фиксировать землетрясения лучше сейсмологов
Кейсы
Новая технология не позволит 3D-напечатанным стенам обрушиться
Строительная 3D-печать
Тим Кук: «Надеюсь дожить до момента, когда наличные выйдут из оборота»
Мнения
Дрон с жестким крылом EagleRay способен летать и плавать под водой
Дроны в законе
Открыт эффективный вид иммунотерапии рака кишечника
Борьба с раком
Dyson работает над целой линейкой электромобилей
Электромобили
Кейсы
В Сиэтле убрали с улиц камеры для слежки за гражданами
Big Buddy Bike — деревянный электровелосипед с авто-балансировкой
Электровелосипеды
Huawei проведет испытания 5G в Ванкувере
Переход на 5G
Цукерберг может продать акции Facebook на $13 млрд
Благотворительность
Pheramor обещает подобрать идеального партнера по ДНК
Генетика
Сделан новый шаг к созданию вакцины против героина
Медицина будущего
Большой Брат
Израильский стартап разработал защиту от распознавания лиц
Генная терапия ВИЧ переживает второе рождение
Медицина будущего
ФБР, ЦРУ и АНБ предупредили об опасности смартфонов Huawei
Кибербезопасность
Facebook в июле представит сразу две умные колонки
Идеи
В британской больнице ИИ помогает врачам делать УЗИ плода
Медицинские технологии
Новый ИИ-процессор позволит запускать нейронные сети на смартфонах
Искусственный интеллект
Изменение климата
Стэнфордские ученые советуют готовиться к климатической катастрофе
Датчик в ботинке позволяет точно определить местоположение без GPS
Навигация
Shell инвестировала в сервис доступа к чистой энергии по подписке
Возобновляемая энергетика
Тренды
Власти США хотят сделать SpaceX глобальным интернет-провайдером
Ученые повернули вспять развитие болезни Альцгеймера у мышей
Медицина будущего
Google выпустит чатбот, который будет отвечать за вас в мессенджерах
Идеи
В США одобрили первый анализ крови на сотрясение мозга
Медицина будущего
В Китае будут контролировать рынок аренды через блокчейн
Блокчейн-технологии
Как получить криптонаследство
Блокчейн
Разработана «нанофабрика», уничтожающая раковые клетки
Биотехнологии