НАУКА
Новости
Научный форум
Космические новости
Энциклопедия космонавтика
Энциклопедия "Естествознание"
Журнальный зал
Физматлит
News of Russian Science and Technology
Научные семинары
Почему молчит Вселенная?
Парниковая катастрофа
Кто перым провел клонирование?
Хронология и парахронология
История и астрономия
Альмагест
Наука и культура
Журналы в сети:
Nature
Успехи физических наук
New Scientist
ScienceDaily
Discovery
ОБРАЗОВАНИЕ
Открытое письмо министру образования
Антиреформа
Соросовский образовательный журнал
Биология
Науки о Земле
Математика и Механика
Технология
Физика
Химия
Русская литература
КОНКУРСЫ
Для молодых биологов
БИБЛИОТЕКИ
Библиотека Хроноса
Научпоп
РАДИО
Читают и поют авторы РП
ОТДЫХ
Музеи
Игры
Песни русского застолья
Народное
Смешное
О НАС
Редколлегия
Авторам
О журнале
Как читать журнал
Пишут о нас
Тираж
РЕСУРСЫ
Поиск
Проекты
Посещаемость
Журналы
Русские писатели и поэты
Избранное
Библиотеки
Фотоархив
ИНТЕРНЕТ
Топ-лист "Русского переплета"
Баннерная сеть
Наши баннеры
НОВОСТИ
Все
Новости русской культуры
Новости науки
Космические новости
Афиша
The best of Russian Science and Technology
|
"Русский переплет" зарегистрирован как СМИ.
Свидетельство о регистрации в Министерстве печати РФ: Эл. #77-4362 от
5 февраля 2001 года. При полном или частичном использовании
материалов ссылка на www.pereplet.ru обязательна.
|
27.08.2010 16:15 |
Ученые расшифровале геном пшеницы
Британские ученые опубликовали черновой вариант расшифровки генома пшеницы - одного из самых важных сельскохозяйственных злаков. Полученные генетические данные . . . |
27.08.2010 16:14 |
Растения научились звать на помощь хищных насекомых
Растения, поедаемые гусеницами, могут "призывать на помощь" хищных насекомых, которые питаются гусеницами. Такие выводы представлены в статье ученых из Германии и . . . |
27.08.2010 14:32 |
Как подключить телевизор к компьютеру?
Компьютеры давно стали настолько производительными, что превратились из рабочего инструмента в современный центр досуга. Сегодня многие покупают компьютер не . . . |
27.08.2010 14:00 |
IBM и Евросоюз сотрудничают в проекте по созданию технологии для крупномасштабной оцифровки европейских исторических текстов Корпорация IBM и Европейский Союз расширили свое исследовательское партнерство, в котором теперь участвуют около тридцати национальных библиотек, научно-исследовательских институтов, университетов и организаций со всей Европы. Цель этого расширенного партнерства - создать новую технологию, которая позволит с высокой точностью и на массовой основе преобразовывать в цифровую форму исторически и культурно значимые текстовые материалы. В отличие от предыдущих проектов по оцифровке текстов, результаты которых оказались статичными и не получили дальнейшего развития, эта уникальная крупномасштабная инициатива, получившая название IMPACT (IMProving ACcess to Text; <улучшение доступа к тестам>), предложит европейским институтам новые инструменты и наилучшие методики, которые дадут им возможность эффективно продолжать создание высококачественных цифровых копий редких исторических текстов, размещая их в Интернете и делая широко доступными для поиска и онлайнового редактирования.
Исследовательский проект IMPACT, финансируемый Евросоюзом, сочетает в себе возможности нового инновационного Web-ориентированного программного обеспечения для адаптивного оптического распознавания символов (OCR) с мощью технологии "crowd computing" - быстроразвивающейся концепции, основанной на совместном использовании коллективных знаний, навыков и опыта многочисленных групп людей (или <толп> людей) для расширения, углубления и совершенствования процесса или продукта с целью коренного улучшения его качества и эффективности. Объединение этих технологий позволит заинтересованным сторонам впервые адаптировать процедуры оцифровки и распознавания текста к особенностям древних шрифтов, к искажениям и аномалиям, и даже к специфическим терминологиям и лексиконам - при сокращении показателей частоты появления ошибок на 35% и частоты замещений и подстановок символов и сочетаний символов на 75%.
.
OCR-технологии сегодня прекрасно справляются с современными печатными текстами, однако старые выцветшие чернила и типографская краска, необычная форма древних шрифтов способны снизить показатели распознавания текста до 50%, что потребует большого объема последующих ручных операций вычитки и правки. Следовательно, для крупномасштабных проектов подобно этому, эффективность последующей обработки оцифрованного текста является критически важным условием. <Единственным путем осуществления крупномасштабного проекта по преобразованию текстов в цифровую форму является коренное улучшение качества первоначального оптического распознавания текста и максимально возможное сокращение последующей ручной обработки, - подчеркнула Хильделиз Балк (Hildelies Balk), руководитель отдела европейских проектов Национальной библиотеки Нидерландов (Koninklijke Bibliotheek) и координатор проекта IMPACT. - С помощью IMPACT мы надеемся достичь значимого улучшения продуктивности процесса оцифровки текстов>.
В основе проекта оцифровки лежит уникальная система коллективной корректуры, разработанная исследователями IBM, которая через интерактивный Web-интерфейс облегчает большим группам добровольцев-корректоров со всего континента проверку правильности обработки текста и исправление ошибок оптического распознавания. Кроме того, система обладает способностью <обучаться> на обнаруженных OCR-ошибках и автоматически адаптироваться к специфике шрифтов.
Технология IMPACT оптимизирует, упрощает и ускоряет процесс исследования отсканированного текста и отбора спорных (сомнительных) участков, предоставляя корректорам возможность эффективно править текст. Вместо отображения полного текста оцифрованной страницы корректоры видят только буквы или слова, помеченные как спорные. Например, комбинация букв "r" и "n" ("rn") может быть неотличима от буквы "m". В подобных случаях система отбирает многие встречающиеся в тесте варианты использования буквы "m" и размещает эти примеры рядом со <спорными> буквами. Данная методика существенно облегчает правильное определение букв в словах текста.
В случаях, когда неочевидным является целое слово, оно добавляется в специальный словарь спорных выражений, которые отсортировываются в алфавитном порядке. Добровольным корректорам нужно лишь <одним щелчком мыши> принять или отвергнуть предлагаемые замены-подставновки. Кроме того, система использует метод адаптивного расширения словаря, когда новые слова добавляются в основной словарь на основе кросс-идентификации и правки другими пользователями.
Так, например, текст небольшой книжки, который <набивается> вручную на компьютере, в среднем, за четыре часа, можно оцифровать с помощью стандартной OCR-технологии и вручную откорректировать за час. Внедрение новой технологии коллективной корректуры сокращает этот процесс до 30 минут. Исследователи IBM отмечают, что новая адаптивная система оптического распознавания текста может дополнительно снизить это время еще на 15 минут.
Исследователи IBM Research из Хайфы обладают опытом разработки уникальных методик OCR, эффективность которых подтверждена годами использования - от инструментов, помогающих отслеживать, классифицировать и категоризировать сообщения и пакеты крупных почтовых служб, до решений по оптимизации считывания символов на номерных знаках автомобилей в системах дорожных сборов как меры борьбы с транспортными перегрузками в крупных городах (congestion pricing). IMPACT, вероятно, является первой реальной попыткой разработать адаптивный механизм оптического распознавания текста, специально предназначенный для создания массовых цифровых библиотек.
О консорциуме IMPACT
В консорциум партнеров проекта IMPACT входят, среди прочих, следующие организации: исследовательский центр IBM в Хайфе, Израиль (IBM Research - Haifa); Национальная библиотека Нидерландов (Koninklijke Bibliotheek); Британская библиотека (British Library); Австрийская национальная библиотека (Österreichische Nationalbibliothek); Университет города Инсбрук, Австрия (Universität Innsbruck); Немецкая национальная библиотека (Deutsche Nationalbibliothek); Баварская государственная библиотека (Bayerische Staatsbibliothek); Государственная и университетская библиотека города Геттинген (Staats- und Universitätsbibliothek Göttingen), Германия; компания ABBYY Production; Институт лексикологии в Лейдене (Instituut voor Nederlandse Lexicologie), Нидерланды; Национальный научно-исследовательский центр "Demokritos" (National Centre for Scientific Research "Demokritos") в Афинах, Греция; Центр информационной и языковой обработки текста (Centrum für Informations- und Sprachverarbeitung) при Мюнхенском университете (University of Munich), Германия; Университет города Бат (University of Bath), Великобритания; Университет города Солфорд (University of Salford), Великобритания; Национальная Библиотека Франции (Bibliothèque Nationale de France); Национальная библиотека Испании (Biblioteca Nacional de España); и Центр высокопроизводительных вычислений и сетей города Познань (Poznan Supercomputing and Networking Center), Польша.
Более подробную информацию об исследовательском подразделении IBM Research можно получить на Web-сайте www.research.ibm.com
Информация о консорциуме IMPACT приводится на Web-сайте http://www.impact-project.eu/
|
27.08.2010 13:41 |
Итоги 11-й летней школы Intel
Корпорация Intel подвела итоги 11-го витка академической программы <Летняя школа Intel>, в рамках которой 65 студентов, магистров и аспирантов из вузов России прошли . . . |
27.08.2010 13:21 |
Intel, Lenovo и Yota - Интернет в движении
Корпорация Intel и компания Lenovo при поддерже Yota, крупнейшего в России оператора Mobile WiMAX, объявляют о старте серии фестивалей . В августе и сентябре в Сочи, Краснодаре и . . . |
27.08.2010 13:16 |
Объявлены результаты школы инновационного предпринимательства 2010
Летняя школа-тренинг по инновационному предпринимательству, организованная при поддержке корпорации Intel, РОСНАНО и МГУ имени М.В.Ломоносова, завершилась . . . |
27.08.2010 13:07 |
IBM рассказала о быстрейшем процессоре в мире
Корпорация IBM сообщила подробности о процессоре z196, который должен стать самым быстрым процессором в мире. Тактовая частота этого чипа составит 5,2 гигагерца, пишет . . . |
26.08.2010 00:53 |
Наука не все понимает...
Физики из Национальной лаборатории Оук-Ридж провели эксперименты, результаты которых не укладываются в современные представления, описывающие строение и . . . |
26.08.2010 00:47 |
Найти потерянное
В Казахстане будет создан единый реестр потерянных и найденных вещей. Об этом сообщает информагентство Kazakhstan Today. О том, что реестр будет создан, заявил Александр . . . |
26.08.2010 00:08 |
Нью-йоркский стадион New Meadowlands оборудуется по последнему слову интернет-технологий
Благодаря технологиям Cisco и Verizon нью-йоркский стадион New Meadowlands предоставит в распоряжение посетителей новейшие функции цифрового видео и беспроводной контент . . . |
26.08.2010 00:00 |
Видеосвязь в акушерстве и гинекологии
Специалисты технологической группы Cisco TelePresence совместно с компанией I.S.P.A.-Engineering завершили проект по организации видеоконференцсвязи для ФГУ <Научный центр . . . |
25.08.2010 23:56 |
Эволюция Интернета в период до 2025 года
Как Интернет будет выглядеть в 2025 году? Насколько вырастет эта сеть, уже сегодня насчитывающая 2 млрд пользователей и поддерживающая рынок объемом в 3 триллиона . . . |
25.08.2010 23:50 |
Канадские железные дороги усовершенствовали связь с помощью спутниковой передачи голоса и данных
Крупнейшая канадская железнодорожная компания Canadian National Railway (CN Rail) предлагает заказчикам множество разнообразных транспортных услуг. Вместе со своими дочерними . . . |
24.08.2010 19:25 |
Обнаружена самая крупная планетная система
Астрономы обнаружили самую большую из известных на сегодня планетарных систем (не считая Солнечной). Если представленные учеными данные подтвердятся, то вокруг . . . |
24.08.2010 19:23 |
Найден дворец Одиссея на Итаке
Археолог Танасис Пападопулос из Иоаннинского университета объявил, что нашел на острове Итака дворец легендарного царя Одиссея, сообщает Suite101.com. Выводы . . . |
24.08.2010 17:27 |
"Планшетомания" началась
Спрос на планшетные устройства типа iPad достиг точки, когда они стали популярнее всех прочих электронных устройств, считают в аналитической фирме Forrester Research. По . . . |
24.08.2010 17:25 |
Intel определила будущее умного телевидения
Intel провела исследование методов и форматов использования телевидения в будущем. На основании полученных результатов компания определила основные направления . . . |
24.08.2010 16:25 |
Intel начнет поставки нового 6-ядерного Core i7 в начале 2011 года
Intel утвердила график поставок своего нового флагманского процессора из серии Extreme Edition, Core i7 990X, сообщает Electronista. Шестиядерный чип основан на архитектуре Gulftown, на . . . |
24.08.2010 14:30 |
Учащимся помогут IBM и облачные вычисления
Корпорация IBM сообщила о партнерстве с компанией Wyse Technology, мировым лидером в сфере сред облачных вычислений для клиентских систем. Цель этого партнерства - . . . |
<< 1941|1942|1943|1944|1945|1946|1947|1948|1949|1950 >>
|
ЛИТЕРАТУРА
Новости русской культуры
К читателю
Содержание
Публицистика
"Курск"
Кавказ
Балканы
Проза
Поэзия
Драматургия
Искания и размышления
Критика
Сомнения и споры
Новые книги
У нас в гостях
Издательство
Книжная лавка
Журнальный зал
ОБОЗРЕНИЯ
"Классики и современники"
"Слово о..."
"Тайная история творений"
"Книга писем"
"Кошачий ящик"
"Золотые прииски"
"Сердитые стрелы"
КУЛЬТУРА
Афиша
Новые передвижники
Фотогалерея
Музыка
"Неизвестные" музеи
Риторика
Русские храмы и монастыри
Видеоархив
ФИЛОСОФИЯ
Современная русская мысль
Искания и размышления
ИСТОРИЯ
ХРОНОС
История России
История в МГУ
Слово о полку Игореве
Хронология и парахронология
Астрономия и Хронология
Альмагест
Запечатленная Россия
Сталиниана
ФОРУМЫ
Дискуссионный клуб
Научный форум
Форум "Русская идея"
Форум "Курск"
Исторический форум
Детский форум
КЛУБЫ
Пятничные вечера
Клуб любителей творчества Достоевского
Клуб любителей творчества Гайто Газданова
Энциклопедия Андрея Платонова
Мастерская перевода
КОНКУРСЫ
За вклад в русскую культуру публикациями в Интернете
Литературный конкурс
Читательский конкурс
Илья-Премия
ДЕТЯМ
Электронные пампасы
Фантастика
Форум
АРХИВ
2001
2000
1999
Фотоархив
Все фотоматериалы
|