Rambler's Top100
Портал | Содержание | О нас | Пишите | Новости | Книжная лавка | Голосование | Топ-лист | Регистрация | Дискуссия
Лучшие молодые
ученые России

Авторские научные обозрения в "Русском переплете"
"Физические явления на небесах" | "Неизбежность странного микромира" | "Биология и жизнь" | "Terra & Comp" | Научно-популярное ревю | Теорфизика для малышей
Семинары - Конференции - Симпозиумы - Конкурсы

TERRA & Comp
С 07 августа 2003 года обозрение ведет Александр Семенов
До 10.07.2002 вел Кирилл Крылов

НАУКА

Новости

Научный форум

Научно-популярный журнал Урания в русском переплете

Космические новости

Энциклопедия космонавтика

Энциклопедия "Естествознание"

Журнальный зал

Физматлит

News of Russian Science and Technology

Научные семинары

Почему молчит Вселенная?

Парниковая катастрофа

Кто перым провел клонирование?

Хронология и парахронология

История и астрономия

Альмагест

Наука и культура

 Журналы в сети:

Nature

Успехи физических наук

New Scientist

ScienceDaily

Discovery

ОБРАЗОВАНИЕ

Открытое письмо министру образования

Антиреформа

Соросовский образовательный журнал

Биология

Науки о Земле

Математика и Механика

Технология

Физика

Химия

Русская литература

Научная лаборатория школьников

КОНКУРСЫ

Лучшие молодые
ученые России

Для молодых биологов

БИБЛИОТЕКИ

Библиотека Хроноса

Научпоп

РАДИО

Читают и поют авторы РП

ОТДЫХ

Музеи

Игры

Песни русского застолья

Народное

Смешное

О НАС

Редколлегия

Авторам

О журнале

Как читать журнал

Пишут о нас

Тираж

РЕСУРСЫ

Поиск

Проекты

Посещаемость

Журналы

Русские писатели и поэты

Избранное

Библиотеки

Фотоархив

ИНТЕРНЕТ

Топ-лист "Русского переплета"

Баннерная сеть

Наши баннеры

НОВОСТИ

Все

Новости русской культуры

Новости науки

Космические новости

Афиша

The best of Russian Science and Technology


"Русский переплет" зарегистрирован как СМИ. Свидетельство о регистрации в Министерстве печати РФ: Эл. #77-4362 от
5 февраля 2001 года. При полном или частичном использовании
материалов ссылка на www.pereplet.ru обязательна.

Тип запроса: "И" "Или"

27.08.2010
14:00

IBM и Евросоюз сотрудничают в проекте по созданию технологии для крупномасштабной оцифровки европейских исторических текстов

    Корпорация IBM и Европейский Союз расширили свое исследовательское партнерство, в котором теперь участвуют около тридцати национальных библиотек, научно-исследовательских институтов, университетов и организаций со всей Европы. Цель этого расширенного партнерства - создать новую технологию, которая позволит с высокой точностью и на массовой основе преобразовывать в цифровую форму исторически и культурно значимые текстовые материалы. В отличие от предыдущих проектов по оцифровке текстов, результаты которых оказались статичными и не получили дальнейшего развития, эта уникальная крупномасштабная инициатива, получившая название IMPACT (IMProving ACcess to Text; <улучшение доступа к тестам>), предложит европейским институтам новые инструменты и наилучшие методики, которые дадут им возможность эффективно продолжать создание высококачественных цифровых копий редких исторических текстов, размещая их в Интернете и делая широко доступными для поиска и онлайнового редактирования.

    Исследовательский проект IMPACT, финансируемый Евросоюзом, сочетает в себе возможности нового инновационного Web-ориентированного программного обеспечения для адаптивного оптического распознавания символов (OCR) с мощью технологии "crowd computing" - быстроразвивающейся концепции, основанной на совместном использовании коллективных знаний, навыков и опыта многочисленных групп людей (или <толп> людей) для расширения, углубления и совершенствования процесса или продукта с целью коренного улучшения его качества и эффективности. Объединение этих технологий позволит заинтересованным сторонам впервые адаптировать процедуры оцифровки и распознавания текста к особенностям древних шрифтов, к искажениям и аномалиям, и даже к специфическим терминологиям и лексиконам - при сокращении показателей частоты появления ошибок на 35% и частоты замещений и подстановок символов и сочетаний символов на 75%.

    .

    OCR-технологии сегодня прекрасно справляются с современными печатными текстами, однако старые выцветшие чернила и типографская краска, необычная форма древних шрифтов способны снизить показатели распознавания текста до 50%, что потребует большого объема последующих ручных операций вычитки и правки. Следовательно, для крупномасштабных проектов подобно этому, эффективность последующей обработки оцифрованного текста является критически важным условием. <Единственным путем осуществления крупномасштабного проекта по преобразованию текстов в цифровую форму является коренное улучшение качества первоначального оптического распознавания текста и максимально возможное сокращение последующей ручной обработки, - подчеркнула Хильделиз Балк (Hildelies Balk), руководитель отдела европейских проектов Национальной библиотеки Нидерландов (Koninklijke Bibliotheek) и координатор проекта IMPACT. - С помощью IMPACT мы надеемся достичь значимого улучшения продуктивности процесса оцифровки текстов>.

    В основе проекта оцифровки лежит уникальная система коллективной корректуры, разработанная исследователями IBM, которая через интерактивный Web-интерфейс облегчает большим группам добровольцев-корректоров со всего континента проверку правильности обработки текста и исправление ошибок оптического распознавания. Кроме того, система обладает способностью <обучаться> на обнаруженных OCR-ошибках и автоматически адаптироваться к специфике шрифтов.

    Технология IMPACT оптимизирует, упрощает и ускоряет процесс исследования отсканированного текста и отбора спорных (сомнительных) участков, предоставляя корректорам возможность эффективно править текст. Вместо отображения полного текста оцифрованной страницы корректоры видят только буквы или слова, помеченные как спорные. Например, комбинация букв "r" и "n" ("rn") может быть неотличима от буквы "m". В подобных случаях система отбирает многие встречающиеся в тесте варианты использования буквы "m" и размещает эти примеры рядом со <спорными> буквами. Данная методика существенно облегчает правильное определение букв в словах текста.

    В случаях, когда неочевидным является целое слово, оно добавляется в специальный словарь спорных выражений, которые отсортировываются в алфавитном порядке. Добровольным корректорам нужно лишь <одним щелчком мыши> принять или отвергнуть предлагаемые замены-подставновки. Кроме того, система использует метод адаптивного расширения словаря, когда новые слова добавляются в основной словарь на основе кросс-идентификации и правки другими пользователями.

    Так, например, текст небольшой книжки, который <набивается> вручную на компьютере, в среднем, за четыре часа, можно оцифровать с помощью стандартной OCR-технологии и вручную откорректировать за час. Внедрение новой технологии коллективной корректуры сокращает этот процесс до 30 минут. Исследователи IBM отмечают, что новая адаптивная система оптического распознавания текста может дополнительно снизить это время еще на 15 минут.

    Исследователи IBM Research из Хайфы обладают опытом разработки уникальных методик OCR, эффективность которых подтверждена годами использования - от инструментов, помогающих отслеживать, классифицировать и категоризировать сообщения и пакеты крупных почтовых служб, до решений по оптимизации считывания символов на номерных знаках автомобилей в системах дорожных сборов как меры борьбы с транспортными перегрузками в крупных городах (congestion pricing). IMPACT, вероятно, является первой реальной попыткой разработать адаптивный механизм оптического распознавания текста, специально предназначенный для создания массовых цифровых библиотек.

    О консорциуме IMPACT

    В консорциум партнеров проекта IMPACT входят, среди прочих, следующие организации: исследовательский центр IBM в Хайфе, Израиль (IBM Research - Haifa); Национальная библиотека Нидерландов (Koninklijke Bibliotheek); Британская библиотека (British Library); Австрийская национальная библиотека (Österreichische Nationalbibliothek); Университет города Инсбрук, Австрия (Universität Innsbruck); Немецкая национальная библиотека (Deutsche Nationalbibliothek); Баварская государственная библиотека (Bayerische Staatsbibliothek); Государственная и университетская библиотека города Геттинген (Staats- und Universitätsbibliothek Göttingen), Германия; компания ABBYY Production; Институт лексикологии в Лейдене (Instituut voor Nederlandse Lexicologie), Нидерланды; Национальный научно-исследовательский центр "Demokritos" (National Centre for Scientific Research "Demokritos") в Афинах, Греция; Центр информационной и языковой обработки текста (Centrum für Informations- und Sprachverarbeitung) при Мюнхенском университете (University of Munich), Германия; Университет города Бат (University of Bath), Великобритания; Университет города Солфорд (University of Salford), Великобритания; Национальная Библиотека Франции (Bibliothèque Nationale de France); Национальная библиотека Испании (Biblioteca Nacional de España); и Центр высокопроизводительных вычислений и сетей города Познань (Poznan Supercomputing and Networking Center), Польша.

    Более подробную информацию об исследовательском подразделении IBM Research можно получить на Web-сайте www.research.ibm.com

    Информация о консорциуме IMPACT приводится на Web-сайте http://www.impact-project.eu/

27.08.2010
13:41

Итоги 11-й летней школы Intel

    Корпорация Intel подвела итоги 11-го витка академической программы <Летняя школа Intel>, в рамках которой 65 студентов, магистров и аспирантов из вузов России прошли . . .

27.08.2010
13:21

Intel, Lenovo и Yota - Интернет в движении

    Корпорация Intel и компания Lenovo при поддерже Yota, крупнейшего в России оператора Mobile WiMAX, объявляют о старте серии фестивалей . В августе и сентябре в Сочи, Краснодаре и . . .

27.08.2010
13:16

Объявлены результаты школы инновационного предпринимательства 2010

    Летняя школа-тренинг по инновационному предпринимательству, организованная при поддержке корпорации Intel, РОСНАНО и МГУ имени М.В.Ломоносова, завершилась . . .

27.08.2010
13:07

IBM рассказала о быстрейшем процессоре в мире

    Корпорация IBM сообщила подробности о процессоре z196, который должен стать самым быстрым процессором в мире. Тактовая частота этого чипа составит 5,2 гигагерца, пишет . . .

26.08.2010
00:53

Наука не все понимает...

    Физики из Национальной лаборатории Оук-Ридж провели эксперименты, результаты которых не укладываются в современные представления, описывающие строение и . . .

26.08.2010
00:47

Найти потерянное

    В Казахстане будет создан единый реестр потерянных и найденных вещей. Об этом сообщает информагентство Kazakhstan Today. О том, что реестр будет создан, заявил Александр . . .

26.08.2010
00:08

Нью-йоркский стадион New Meadowlands оборудуется по последнему слову интернет-технологий

    Благодаря технологиям Cisco и Verizon нью-йоркский стадион New Meadowlands предоставит в распоряжение посетителей новейшие функции цифрового видео и беспроводной контент . . .

26.08.2010
00:00

Видеосвязь в акушерстве и гинекологии

    Специалисты технологической группы Cisco TelePresence совместно с компанией I.S.P.A.-Engineering завершили проект по организации видеоконференцсвязи для ФГУ <Научный центр . . .

25.08.2010
23:56

Эволюция Интернета в период до 2025 года

    Как Интернет будет выглядеть в 2025 году? Насколько вырастет эта сеть, уже сегодня насчитывающая 2 млрд пользователей и поддерживающая рынок объемом в 3 триллиона . . .

25.08.2010
23:50

Канадские железные дороги усовершенствовали связь с помощью спутниковой передачи голоса и данных

    Крупнейшая канадская железнодорожная компания Canadian National Railway (CN Rail) предлагает заказчикам множество разнообразных транспортных услуг. Вместе со своими дочерними . . .

24.08.2010
19:25

Обнаружена самая крупная планетная система

    Астрономы обнаружили самую большую из известных на сегодня планетарных систем (не считая Солнечной). Если представленные учеными данные подтвердятся, то вокруг . . .

24.08.2010
19:23

Найден дворец Одиссея на Итаке

    Археолог Танасис Пападопулос из Иоаннинского университета объявил, что нашел на острове Итака дворец легендарного царя Одиссея, сообщает Suite101.com. Выводы . . .

24.08.2010
17:27

"Планшетомания" началась

    Спрос на планшетные устройства типа iPad достиг точки, когда они стали популярнее всех прочих электронных устройств, считают в аналитической фирме Forrester Research. По . . .

24.08.2010
17:25

Intel определила будущее умного телевидения

    Intel провела исследование методов и форматов использования телевидения в будущем. На основании полученных результатов компания определила основные направления . . .

24.08.2010
16:25

Intel начнет поставки нового 6-ядерного Core i7 в начале 2011 года

    Intel утвердила график поставок своего нового флагманского процессора из серии Extreme Edition, Core i7 990X, сообщает Electronista. Шестиядерный чип основан на архитектуре Gulftown, на . . .

24.08.2010
14:30

Учащимся помогут IBM и облачные вычисления

    Корпорация IBM сообщила о партнерстве с компанией Wyse Technology, мировым лидером в сфере сред облачных вычислений для клиентских систем. Цель этого партнерства - . . .

24.08.2010
14:26

Мировой рекорд по скорости набора текста

    Как сообщает сайт www.3dnews.ru, 25,94 секунды потребовалось 27-летней жительнице города Солфорд, расположенного на западе Англии, Мелиссе Томпсон (Melissa Thompson), чтобы при . . .

24.08.2010
14:24

Создан вероятностный чип для компьютеров

    Базовые принципы построения компьютеров, незыблемые вот уже более шестидесяти лет, пошатнулись. Новый процессор на физическом уровне оперирует не "жёсткими" . . .

24.08.2010
14:21

ИТ-специалисты разлюбили свою профессию

    В рамках конференции Enterprise 2.0, проходившей в Бостоне, была организована неформальная дискуссия "Давно забытая 40-часовая неделя", участники которой поделились . . .

<< 1951|1952|1953|1954|1955|1956|1957|1958|1959|1960 >>

ЛИТЕРАТУРА

Новости русской культуры

К читателю

Содержание

Публицистика

"Курск"

Кавказ

Балканы

Проза

Поэзия

Драматургия

Искания и размышления

Критика

Сомнения и споры

Новые книги

У нас в гостях

Издательство

Книжная лавка

Журнальный зал

ОБОЗРЕНИЯ

"Классики и современники"

"Слово о..."

"Тайная история творений"

"Книга писем"

"Кошачий ящик"

"Золотые прииски"

"Сердитые стрелы"

КУЛЬТУРА

Афиша

Новые передвижники

Фотогалерея

Музыка

"Неизвестные" музеи

Риторика

Русские храмы и монастыри

Видеоархив

ФИЛОСОФИЯ

Современная русская мысль

Искания и размышления

ИСТОРИЯ

ХРОНОС

История России

История в МГУ

Слово о полку Игореве

Хронология и парахронология

Астрономия и Хронология

Альмагест

Запечатленная Россия

Сталиниана

ФОРУМЫ

Дискуссионный клуб

Научный форум

Форум "Русская идея"

Форум "Курск"

Исторический форум

Детский форум

КЛУБЫ

Пятничные вечера

Клуб любителей творчества Достоевского

Клуб любителей творчества Гайто Газданова

Энциклопедия Андрея Платонова

Мастерская перевода

КОНКУРСЫ

За вклад в русскую культуру публикациями в Интернете

Литературный конкурс

Читательский конкурс

Илья-Премия

ДЕТЯМ

Электронные пампасы

Фантастика

Форум

АРХИВ

2001

2000

1999

Фотоархив

Все фотоматериалы

Помощь корреспонденту Добавить новость
НАУКА В "РУССКОМ ПЕРЕПЛЕТЕ"

Если Вы хотите стать нашим корреспондентом напишите lipunov@sai.msu.ru

 

© 1999, 2000 "Русский переплет"
Дизайн - Алексей Комаров

Rambler's Top100