Rambler's Top100
Портал | Содержание | О нас | Пишите | Новости | Книжная лавка | Голосование | Топ-лист | Регистрация | Дискуссия
Лучшие молодые
ученые России

Авторские научные обозрения в "Русском переплете"
"Физические явления на небесах" | "Неизбежность странного микромира" | "Биология и жизнь" | "Terra & Comp" | Научно-популярное ревю | Теорфизика для малышей
Семинары - Конференции - Симпозиумы - Конкурсы

TERRA & Comp
С 07 августа 2003 года обозрение ведет Александр Семенов
До 10.07.2002 вел Кирилл Крылов

НАУКА

Новости

Научный форум

Научно-популярный журнал Урания в русском переплете

Космические новости

Энциклопедия космонавтика

Энциклопедия "Естествознание"

Журнальный зал

Физматлит

News of Russian Science and Technology

Научные семинары

Почему молчит Вселенная?

Парниковая катастрофа

Кто перым провел клонирование?

Хронология и парахронология

История и астрономия

Альмагест

Наука и культура

 Журналы в сети:

Nature

Успехи физических наук

New Scientist

ScienceDaily

Discovery

ОБРАЗОВАНИЕ

Открытое письмо министру образования

Антиреформа

Соросовский образовательный журнал

Биология

Науки о Земле

Математика и Механика

Технология

Физика

Химия

Русская литература

Научная лаборатория школьников

КОНКУРСЫ

Лучшие молодые
ученые России

Для молодых биологов

БИБЛИОТЕКИ

Библиотека Хроноса

Научпоп

РАДИО

Читают и поют авторы РП

ОТДЫХ

Музеи

Игры

Песни русского застолья

Народное

Смешное

О НАС

Редколлегия

Авторам

О журнале

Как читать журнал

Пишут о нас

Тираж

РЕСУРСЫ

Поиск

Проекты

Посещаемость

Журналы

Русские писатели и поэты

Избранное

Библиотеки

Фотоархив

ИНТЕРНЕТ

Топ-лист "Русского переплета"

Баннерная сеть

Наши баннеры

НОВОСТИ

Все

Новости русской культуры

Новости науки

Космические новости

Афиша

The best of Russian Science and Technology


"Русский переплет" зарегистрирован как СМИ. Свидетельство о регистрации в Министерстве печати РФ: Эл. #77-4362 от
5 февраля 2001 года. При полном или частичном использовании
материалов ссылка на www.pereplet.ru обязательна.

Тип запроса: "И" "Или"

30.03.2019
18:55

Магнитное поле Солнца оказалось в десять раз мощнее, чем считалось ранее

    Магнитное поле Солнца на самом деле оказалось примерно в 10 раз мощнее, чем считалось ранее, согласно новому исследованию, проведенному астрономами из . . .

30.03.2019
18:51

Наблюдения «звездотрясений» позволили выяснить параметры «горячего сатурна»

    Космическая обсерватория НАСА под названием TESS (Transiting Exoplanet Survey Satellite) впервые обнаружила планету, обращающуюся вокруг звезды, на которой происходят доступные для . . .

30.03.2019
18:11

OSIRIS-REx показал 52-метровую скалу на поверхности Бенну

    Исследователи из команды миссии OSIRIS-REx создали стереопару, благодаря которой можно ощутить в объеме 52-метровую скалу на поверхности астероида Бенну. Подобные . . .

30.03.2019
17:58

Зонд «Паркер» начал второе тесное сближение с Солнцем

    Солнечный зонд «Паркер» начал второе тесное сближение с Солнцем: 4 апреля он пролетит на минимальном на данный момент расстоянии от звезды (около 24 миллионов . . .

30.03.2019
16:13

Специалисты NASA доказали, что их космический вертолёт сможет летать на Марсе

    Специалисты, задействованные в проекте Национального управления США по воздухоплаванию и исследованию космического пространства (NASA) «Марс», завершили работу по . . .

30.03.2019
06:25

Темные полосы на склонах марсианских кратеров связали с сезонным поднятием глубинных вод

    Выдвинута новая теория образования темных полос на склонах марсианских кратеров, согласно которой ключевую роль в их появлении играет поднимающаяся с больших . . .

29.03.2019
20:45

Английский язык уместился в полтора мегабайта

    Американские психологи подсчитали объем информации, который к 18 годам выучивает англоговорящий человек о своем родном языке. По их подсчетам, максимальный объем таких данных составляет около 12,5 миллиона бит: всю информацию о языке, таким образом, почти целиком можно уместить на стандартной трехдюймовой дискете. При этом бóльшая часть хранимой информации посвящена лексической семантике. Статья опубликована в журнале Royal Society Open Science.

    Самый простой способ записи и хранения информации — двоичный код: в таком виде информация хранится на цифровых носителях, а также в виде набора нолей и единиц можно представить и ту информацию об окружающем мире, которую человек получает и хранит у себя в голове. При этом устройство двоичного кода не дает компактно хранить всю информацию об объекте. Представим, к примеру, черничный пирог. Всю информацию и черничном пироге — то, как он выглядит, какой он на вкус, как называется ягода, которая входит в его состав, какого она цвета и так далее — представить в виде одного бита невозможно. Вместо этого ее приходится хранить в виде своеобразных ответов на разные вопросы. Например, что касается того же пирога, ответ на вопрос «Это пирог?» будет «Да», на вопрос «Он абрикосовый?» ответом будет «Нет», поэтому этот кластер информации о пироге может выглядеть как 1 0, то есть занимать два бита.

    Разумеется, в мире есть и другие объекты помимо пирогов, и по разным подсчетам человеческая память способна хранить от 109 до 1020 бит информации, а на каждый объект приходится от 10 до 14 битов. В новой работе Фрэнсис Моллика (Francis Mollica) из Рочестерского университета и Стивен Пьянтадоси (Steven Piantadosi) из Калифорнийского института в Беркли решили подсчитать, какой объем занимает языковая информация, которую получает человек с рождения до наступления совершеннолетия. Ученые сосредоточились на англоговорящих людях, а информацию о языке разбили на несколько категорий: фонемы, словоформы, лексическая семантика, частотность слов и синтаксис.

    Для расчета объема информации в каждой категории ученые воспользовались теорией сокращения информационной энтропии, в соответствии с которой для каждой репрезентации R есть некоторое количество неопределенности H. То есть любой объект, который можно познать, сначала представляется в виде неопределенности H(R). При этом есть некоторая информация D: она относится к R и может сократить информационную энтропию. Далее информацию о каком-то объекте можно перевести в биты с помощью разницы в неопределенности до обучения H(R) и неопределенности после обучения H(R|D).

    В качестве трех основных параметров получения информации о фонемах ученые приняли время начала озвончения в миллисекундах (количественный параметр, который, к примеру, помогает разграничить [п] и [б]), частота фрикации в барках (артикуляционные особенности, помогающие разграничить фрикативные согласные, например, отличить [с] и [з]) и частоты формант гласных звуков в мелах. На основе известных границ длительности озвончения и воспринимаемых человеком частот, ученые выяснили, что время для начала озвончения звонких и глухих (для глухих — отрицательное число, так как озвончения нет) согласных нужно 5 и 3 бита соответственно, для частоты фрикации — 3 бита, а для определения частоты формант гласных — 15 бит. Учитывая количество фонем в английском языке (50) и в зависимости от того, сколько бит информации каждая из них требует, всю фонетическую систему языка можно, по оценкам ученых, уместить в 375–1500 битах.

    Вторая категория — словоформы — в понимании ученых содержит только оболочку слова, то есть набор фонем, которые нужны, чтобы это слово произнести или распознать при прослушивании. Они ограничили средний объем лексикона взрослого англоговорящего человека 40 тысячью словами. Воспользовавшись базой лингвистических данных CELEX, ученые выяснили среднее количество фонов (фонетических единиц речи) для каждого слова, а затем рассчитали на основе этого, сколько битов необходимо для одного слова. Получилось, по разным моделям, 5, 10 и 16, что соответствует объему от 200 до 640 тысяч бит для хранения словоформ.

    Для того, чтобы рассчитать объем информации, относящейся к лексической семантике слов, ученые представили все значения всех слов в многомерном векторном пространстве R. В нем есть определенное слово — например, слово «яблоко», — которое попадает не только в пространство R, но и в пространство r чуть поменьше. При этом R содержит r, но неизвестно, где именно это r находится. И, хотя R содержит информацию о фруктах, овощах, коровах, глобальном потеплении и всех других объектах, нужно именно пространство r — потому что в нем содержится только релевантная информация: для сокращения информационной энтропии, поэтому, необходимо сократить R до r.

    Чтобы это оценить, ученые проанализировали векторное представления 10 тысяч существительных в WordNet. В качестве r для каждого слова взяли расстояние до ближайших точек в пространстве, а в качестве R — расстояние до самых дальних. По расчетам ученых, процесс сокращения R до r, то есть нахождение того самого меньшего пространства для каждого слова может занимать до 2 бит. При этом семантическое пространство не одномерно, а многомерно, и количество измерений в нем, по разным оценкам, варьируется от 100 до 500. Объем информации о лексической семантике, таким образом, по подсчетам ученых занимает от 500 тысяч до 40 миллионов бит, учитывая лексикон в 40 тысяч слов.

    Для оценки объема памяти, необходимого для хранения информации о частотности слов, ученые воспользовались помощью 251 добровольца, каждого из которых попросили сравнить два слова по частотности: то есть решить, какое из них в речи встречается чаще всего. Они выяснили, что точность участников составляет около 76,6 процента — то есть где-то в трех случаях из четырех они правильно угадывали, насколько слово частотное. Смоделировав точность участников при выполнении задания в виде того, сколько частот всего они могут определить (оценив недостающие 23,4 процента как вероятность того, что два слова попадут в одну категорию), они выяснили, что люди примерно распределяют частотность по четырем категориям. Для определения частоты слова, таким образом, необходимо где-то от 1 до 3 бит информации: то есть для всех слов — от 40 до 120 тысяч бит.

    Наконец, для синтаксиса ученые решили подсчитать количество предложений с уникальной синтаксической структурой вне контекста и необходимый объем памяти, который позволяет отличить одну структуру от другой. У ученых вышло 134, 697 и 1394 бита в зависимости от того, сколько уникальных синтаксических конструкций может распознать человек.

    Авторы, таким образом, подсчитали, что вся информация, которую англоговорящий человек получает о своем языке с раннего детства до 18 лет, можно поместить в достаточно небольшом объеме памяти: от 794 тысяч до 40 миллионов бит. При этом средний показатель (best guess по всем категориям) равняется 12,48 миллиона бит или около 1,5 мегабайта. При этом ученые уточняют, что их расчеты очень грубые и примерные, и скорее годятся для какого-либо теоретического обоснования, а не для применения в информационных технологиях. К примеру, их расчеты показали, что самым затратным по занимаемому объему памяти является лексическая семантика, а вот синтаксис, наоборот, места занимает очень мало.

    По информации https://nplus1.ru/news/2019/03/29/language-storage

29.03.2019
20:42

Прототип ABRACADABRA не помог найти темную материю

    Физики опубликовали детальное описание нового эксперимента по поиску сверхлегких частиц темной материи ABRACADABRA и подвели итоги работы прототипа. Полноценная . . .

29.03.2019
18:20

Эксперты: изменение климата уже вызвало катастрофы, которые затронули 62 млн человек

    Потепление климата усугубляется с каждым годом — с 2015 по 2018 годы планета стабильно ставила температурные рекорды. Ситуация продолжает усугубляться — новые . . .

29.03.2019
18:05

Российские физики намерены поставить рекорд, запустив пучок нейтрино в Средиземное море

    Ожидается, что нейтринный луч пройдет сквозь недра Земли 2,6 тыс. км, пока не будет пойман и исследован детектором Ученые Национального исследовательского центра . . .

29.03.2019
17:54

Искусственные облака: как геоинженеры борются с загрязнением воздуха

    Загрязнение воздуха — одна из главных предотвратимых причин смертности, появлению которой человечество обязано своей деятельностью. Сейчас проблема в большей . . .

29.03.2019
17:48

Китайцы создали искусственный остров в Южно-Китайском море. Экологический урон оказался в 200 раз больше его площади

    Площадь экологического урона от появления искусственного острова на коралловом рифе Мисчиф в Южно-Китайском море оказалась в 200 раз больше, чем его площадь — 1,2 . . .

29.03.2019
17:41

Россия развернула выпуск твердотельных накопителей большой емкости

    Российская компания GS Nanotech приступила к производству твердотельных накопителей (Solid State Drive, SSD) большой емкости с современным интерфейсом PCI Express, обеспечивающим . . .

29.03.2019
17:26

Как распад вакуума уничтожить Вселенную

    Каждую минуту существования нас сопровождает один печальный факт: всему когда-нибудь придет конец. И Вселенная не исключение. Согласно современному пониманию . . .

29.03.2019
17:17

Глобальные выбросы углекислого газа обновили в 2018 году исторический рекорд

    Международное энергетическое агентство (МЭА) опубликовало ежегодный отчет, посвященный тенденциям в мировой энергетике и связанными с ними объемами выбросов . . .

29.03.2019
17:07

Телескоп «Hubble» запечатлел самоуничтожение гигантского астероида

    Четкие изображения с «Hubble» предоставили исследователям новое понимание необычного прошлого астроида Голт. Благодаря объединению данных с наземных телескопов и . . .

29.03.2019
17:04

Президент РАН рассказал, зачем нужно исследовать Луну

    Поверхность Луны является практическим идеальным местом для изучения сигналов, приходящих из космоса, рассказал РИА Новости президент Российской академии наук . . .

29.03.2019
16:59

Лазер помог физикам из России создать абсолютно прозрачный кристалл

    Российские ученые выяснили, как сделать любой кристалл абсолютно прозрачным для света, обработав его сверхкороткими вспышками лазера. Подобная технология . . .

29.03.2019
16:53

Астросейсмология помогла узнать свойства горячего сатурна

    Астрономы благодаря космическому телескопу TESS и методам астросейсмологии открыли горячий cатурн на орбите вокруг красного гиганта. Это говорит о том, что . . .

29.03.2019
16:50

Необычную форму спутников Сатурна связали с аккрецией частиц из его колец

    Благодаря данным, собранным межпланетной станцией «Кассини», астрономы смогли доказать, что за необычную форму внутренних небольших спутников Сатурна . . .

<< 791|792|793|794|795|796|797|798|799|800 >>

ЛИТЕРАТУРА

Новости русской культуры

К читателю

Содержание

Публицистика

"Курск"

Кавказ

Балканы

Проза

Поэзия

Драматургия

Искания и размышления

Критика

Сомнения и споры

Новые книги

У нас в гостях

Издательство

Книжная лавка

Журнальный зал

ОБОЗРЕНИЯ

"Классики и современники"

"Слово о..."

"Тайная история творений"

"Книга писем"

"Кошачий ящик"

"Золотые прииски"

"Сердитые стрелы"

КУЛЬТУРА

Афиша

Новые передвижники

Фотогалерея

Музыка

"Неизвестные" музеи

Риторика

Русские храмы и монастыри

Видеоархив

ФИЛОСОФИЯ

Современная русская мысль

Искания и размышления

ИСТОРИЯ

ХРОНОС

История России

История в МГУ

Слово о полку Игореве

Хронология и парахронология

Астрономия и Хронология

Альмагест

Запечатленная Россия

Сталиниана

ФОРУМЫ

Дискуссионный клуб

Научный форум

Форум "Русская идея"

Форум "Курск"

Исторический форум

Детский форум

КЛУБЫ

Пятничные вечера

Клуб любителей творчества Достоевского

Клуб любителей творчества Гайто Газданова

Энциклопедия Андрея Платонова

Мастерская перевода

КОНКУРСЫ

За вклад в русскую культуру публикациями в Интернете

Литературный конкурс

Читательский конкурс

Илья-Премия

ДЕТЯМ

Электронные пампасы

Фантастика

Форум

АРХИВ

2001

2000

1999

Фотоархив

Все фотоматериалы

Помощь корреспонденту Добавить новость
НАУКА В "РУССКОМ ПЕРЕПЛЕТЕ"

Если Вы хотите стать нашим корреспондентом напишите lipunov@sai.msu.ru

 

© 1999, 2000 "Русский переплет"
Дизайн - Алексей Комаров

Rambler's Top100