Как язык дает отдых вашему мозгу

Вот быстрое задание: взгляните на предложения ниже и решите, какое из них наиболее эффективно. (1) "Джон выбросил старый хлам, лежавший на кухне." (2) "Джон выбросил старый хлам, лежавший на кухне."

Любое предложение грамматически приемлемо, но вы, вероятно, сочли первое более естественным. Почему? Возможно, из-за размещения слова "из," что, кажется, лучше вписывается в середину этой последовательности слов, чем в конец.

С технической точки зрения первое предложение короче "длина зависимости"- более короткое общее расстояние, в словах, между ключевыми элементами предложения. Новое исследование 37 языков, проведенное тремя исследователями из Массачусетского технологического института, показало, что большинство языков движутся в сторону "минимизация длины зависимости" (DLM) на практике. Это означает, что пользователи языка имеют глобальное предпочтение для более локально сгруппированных зависимых слов, когда это возможно.

"Люди хотят, чтобы связанные друг с другом слова в предложении были близко друг к другу," говорит Ричард Футрелл, аспирант кафедры мозга и когнитивных наук Массачусетского технологического института и ведущий автор новой статьи, в которой подробно описаны результаты. "Существует идея, что расстояние между грамматически связанными словами в предложении должно быть коротким, как принцип."

В статье, опубликованной на этой неделе в Proceedings of the National Academy of Sciences, предполагается, что люди видоизменяют язык таким образом, потому что это упрощает работу нашего разума – говорящего, слушающего и читающего.

"Когда я говорю с вами, и вы пытаетесь понять, что я говорю, вы должны проанализировать это и выяснить, какие слова связаны друг с другом," Футрелл наблюдает. "Если между одним словом и другим связанным словом проходит много времени, это означает, что вам нужно удерживать одно из этих слов в памяти, а это может быть сложно сделать."

Хотя существование DLM ранее предполагалось и идентифицировалось на нескольких языках, это крупнейшее исследование такого рода на сегодняшний день.

"Это было довольно интересно, потому что люди на самом деле смотрели только на одном или двух языках," говорит Эдвард Гибсон, профессор когнитивных наук и соавтор статьи. "Мы думали, что это, вероятно, правда [в более широком смысле], но это очень важно показать. … Мы не демонстрируем идеальной оптимизации, но [DLM] – это фактор, который имеет значение."

От головы до хвоста

Для проведения исследования исследователи использовали четыре большие базы данных предложений, которые были проанализированы грамматически: одну из Карлова университета в Праге, одну из Google, одну из Universal Dependencies Consortium (новую группу компьютерных лингвистов) и китайскоязычную. база данных Консорциума лингвистических зависимостей Пенсильванского университета. Предложения взяты из опубликованных текстов и, таким образом, отражают повседневное использование языка.

Чтобы количественно оценить эффект от размещения связанных слов ближе друг к другу, исследователи сравнили длину зависимости предложений с парой базовых показателей длины зависимости в каждом языке. Одна базовая линия рандомизирует расстояние между каждым "голова" слово в предложении (например, "бросил," выше) и "зависимый" слова (например, "из"). Однако, поскольку некоторые языки, включая английский, имеют относительно строгие правила порядка слов, исследователи также использовали вторую базовую линию, которая учитывала влияние этих отношений порядка слов.

В обоих случаях, как обнаружили Футрелл, Гибсон и соавтор Кайл Маховальд, тенденция DLM существует, в разной степени, среди языков. Итальянский, кажется, оптимизирован для коротких предложений; Согласно анализу, немецкий язык, в котором есть несколько заведомо косвенных конструкций предложений, гораздо менее оптимизирован.

И исследователи также обнаружили, что "финал" в таких языках, как японский, корейский и турецкий, где заглавное слово идет последним, минимизация длины меньше, чем обычно. Это может быть связано с тем, что в этих языках есть обширная разметка регистра, которая обозначает функцию слова (является ли существительное субъектом, прямым объектом и т. Д.). Маркировка корпуса, таким образом, компенсирует потенциальную путаницу с большими длинами зависимостей.

"Возможно, на языках, где это действительно очевидно из отметки регистра, где слово вписывается в предложение, это может означать, что сохранение локальных зависимостей менее важно," Футрелл говорит.

Футрелл, Гибсон и Маховальд с готовностью отмечают, что исследование оставляет открытыми более широкие вопросы: возникает ли тенденция DLM в первую очередь для помощи в создании языка, его восприятии, более строго когнитивной функции или всему вышеперечисленному??

"Это может быть говорящий, слушатель или и то, и другое," Гибсон говорит. "Их очень сложно разделить."