4625.03.01;МТ.01;1

ALEX SGA
Центр помощи студентам СГА © 2010-2017
· Алекс Финаев

Для быстрого поиска нужного вопроса нажмите ctrl+f
Если ответы не подходят, сообщите нам в вконтакте Алекс Финаев (Сга) и мы исправит ошибку!
Вопросы всех ответов отсортированы по алфавиту

 Процесс вербализации определенного содержания по законам определенного жанра, выполняемый на компьютере, называется
   -> автоматическим порождением текста
   автоматическим индексированием
   автоматическим реферированием
   интеллектуальной обработкой данных

Установите соответствия

   -> 1-c, 2- d, 3-e, 4-b
   1-c, 2-a, 3-e, 4-d
   1-b, 2-d, 3-e, 4-a
   1-e, 2-a, 3-b, 4-d
Quark Publishing System – это
   -> программная система для организации коллективного труда в редакциях периодики
   самая популярная в мире программа компьютерной верстки
   графический редактор
   система автоматической классификации документов
Автоматическая классификация документов – это
   -> разбивка множества текстов на кластеры в зависимости от их содержания и/или тематики
   описание содержания документов с помощью набора ключевых слов
   составление краткого реферата документов
   автоматическое составление каталога
Автоматический индекс в сети Интернет состоит из: 1) программы-робота; 2) базы данных; 3) иерархически упорядоченного набора категорий; 4) пользовательского интерфейса; 5) поисковой службы-каталога
   -> 1,2,4
   1,3,5
   2,3,5
   2,5
Базовая аксиома машинного индексирования состоит в том, что
   -> если слово есть в тексте, то оно отражает содержание данного текста
   надо использовать как можно более специфичные по содержанию индексные термины
   эффективность индексирования напрямую зависит от используемого языка индексирования
   если слово встретилось в тексте, то это еще не значит, что оно отражает его содержание
Более узкие, специфичные по содержанию, индексные термины положительно влияют на такую характеристику информационного поиска, как
   -> точность поиска
   широта используемых терминов
   полнота поиска
   полнота индексирования
В основе систем статистического распознавания речи лежат: 1) словарь фонетических и/или фонемных транскрипций; 2) модель языка, задающая ограничения на построение предложений; 3) набор слов-гипотез; 4) набор вероятностей для различных последовательностей слов языка; 5) основные надежные признаки звуковых единиц, используемые для первичной грубой сегментации звукового сигнала; 6) метод определения ударных слогов
   -> 1,2,4
   2,3,4,6
   1,2,5
   3,4,6
В процессе машинного индексирования индексные дескрипторы
   -> создаются путем анализа словарного состава индексируемого текста
   берутся из специального словаря
   приписываются человеком-экспертом
   порождаются компьютером случайным образом
Вес индексного термина – это
   -> количественная характеристика, отражающая значимость слова в данном тексте
   то, сколько раз слово встретилось в тексте
   то же самое, что ранг слова по закону Ципфа
   количество индексных терминов
Два основных направления разработки систем анализа речи – это: 1) распознавание ограниченного набора слов; 2) дикторозависимое распознавание; 3) дикторонезависимое распознавание; 4) декодирование языковой структуры речевого сигнала; 5) распознавание на основе математической модели распознавания образов
   -> 1,4
   2,5
   2,3
   4,5
Для выполнения морфологического анализа на основе статистических алгоритмов необходимо иметь: 1) неразмеченный корпус текстов определенного размера; 2) размеченный корпус текстов, где каждому слову приписана грамматическая информация; 3) определенный набор продукционных правил морфологического анализа; 4) информацию о частоте встречаемости последовательностей лексико-грамматических классов
   -> 2,4
   1,3
   1,2
   3,4
Значимые слова, которые действительно описывают содержание текста, лежат в ______________ части графика зависимости ранга слова от частоты
   -> средней
   верхней
   нижней
   отрицательной
Из перечисленного: 1) идентифицировать и выделить слова в тексте; 2) обратиться к словарю за словарной информацией о слове; 3) определить значение слова; 4) разбить текст на синтаксические единицы – морфологический анализ нужен для того, чтобы
   -> 1,2
   2,3
   3,4
   1,4
Из перечисленного: 1) информационно-поисковые системы; 2) системы машинного перевода; 3) системы обработки графической информации; 4) системы анализа запросов к базам данных; 5) вопросно-ответные системы; 6) операционные системы – морфологический и синтаксический анализ могут использоваться в
   -> 1,2,4,5
   2,4,5
   1,2,3,6
   2,4,5,6
Из перечисленного: 1) модуль обработки графической информации; 2) база знаний; 3) модуль текстового анализа; 4) модуль синтеза звучащей речи; 5) модуль поиска и сравнения; 6) модуль решения задач; 7) модуль аналитической обработки данных – архитектура систем полного понимания текста должна включать в себя
   -> 2,3,5,6
   2,3,5,7
   1,2,3,5,7
   1,4,7
Из перечисленного: 1) повествовательные; 2) описательные; 3) критические; 4) информативные; 5) предписывающие; 6) сжатые – по своей функции выделяются следующие типы рефератов:
   -> 1,3,4
   1,5,6
   2,5,6
   2,3,4
К источникам вариативности звуковых единиц относятся 1) коартикуляционные явления; 2) болезни органов слуха; 3) междикторская вариативность; 4) внутридикторская вариативность; 5) несовершенство современных анализаторов звучащей речи; 6) технические условия записи речи; 7) уровень технической оснащенности
   -> 1,3,4,6
   1,2,5,7
   1,2,3,6
   2,4,5,7
Компьютерный программный продукт, обеспечивающий ту часть редакционно-издательской деятельности, которая связана с подготовкой рукописей к печати, называется
   -> редакционно-издательской системой
   платформой компьютерной верстки
   операционной системой
   текстовым редактором
Лингвистическая теория речеобразования в системах синтеза речи рассматривает
   -> акустические и физические характеристики фонем
   синтаксические и морфологические особенности речи
   особенности словоупотребления в речи
   просодические и фонетические характеристики речи
Метод кластеризации применяется для
   -> объединения терминов в классы
   повышения полноты поиска
   генерации терминов-фраз
   повышения точности индексирования
Метод составления выдержек основан на вычислении весовых коэффициентов для блоков текста, которое базируется на следующих факторах: 1) место данного фрагмента в тексте; 2) тема данного фрагмента; 3) наличие ключевых фразовых шаблонов; 4) концентрация ключевых слов; 5) лексическое значение ключевых слов; 6) наличие терминов в заголовке, колонтитуле и др.; 7) средняя длина предложения в данном фрагменте
   -> 1,3,4,6
   2,3,4,7
   3,5,6,7
   1,2,5,7
На этапе акустического синтеза происходит
   -> преобразование параметризованной фонетической транскрипции в звуковой сигнал
   просодическая параметризация звуковых сегментов
   преобразование орфографической записи слова в фонемную
   обработка слов, читающихся нестандартным образом
На этапе лингвистической обработки в процессе синтеза речи происходит: 1) проверка орфографии и пунктуации; 2) построение сегментно-фонетической транскрипции; 3) придание звучанию текста эмоциональной окраски; 4) нормализация текста; 5) полный семантико-синтаксический анализ текста; 6) просодическая параметризация текста; 7) приписывание интонационно-просодических характеристик сегментам текста
   -> 1,2,4,6,7
   1,2,3,4,7
   2,4,5,6,7
   1,2,5,7
Набор рубрик для автоматической классификации может задаваться пользователем; каждая рубрика в этом случае описывается через: 1) набор ключевых слов; 2) определенную тематику; 3) краткий реферат; 4) обучающие эталонные документы; 5) иерархический каталог
   -> 1,4
   2
   5
   3,5
Наиболее доступным для обработки на компьютере видом информации является
   -> письменный текст
   графика
   звучащая речь
   музыка
Недостатки существующих систем автоматического реферирования связаны с тем, что они: 1) могут составлять реферат только из выдержек из исходного текста; 2) могут составлять реферат только с опорой на базу знаний; 3) могут работать только с текстами на русском языке; 4) не могут обрабатывать источники нетекстовой информации; 5) не могут делать реферат по нескольким источникам, передающим одну и ту же информацию; 6) могут совместно работать только с определенными операционными системами
   -> 1,4,5
   1,4,5,6
   3,4,5
   1,3,5,6
Новые сферы применения автоматического реферирования – это: 1) многоязычные средства реферирования; 2) средства реферирования для языков с нестандартной графикой (иероглифы, слоговое письмо, арабское письмо и пр.); 3) реферирование с голоса; 4) реферирование неоднородно представленной информации; 5) реферирование на больших корпусах документов; 6) реферирование в Интернете
   -> 1,4,5
   2,5,6
   1,3,6
   2,3,5
Обучение статистических систем, в процессе которого строятся акустико-фонетические и фонетические модели, происходит с помощью
   -> большого корпуса устной речи
   большого корпуса письменных текстов
   специальных правил
   словарей и грамматик
Основной задачей синтаксического анализа является
   -> построение дерева синтаксических зависимостей между синтаксическими составляющими предложения
   перевод синтаксических конструкций с языка на язык
   продолжение морфологического анализа
   построение семантического представления обрабатываемого текста на основе его синтаксиса
Основные трудности в построении систем понимания текста машиной связаны с тем, что
   -> понимание опирается на знания воспринимающей системы
   у человека меньше объем памяти, чем у компьютера
   машина не может вести диалог с человеком
   компьютерный анализ в принципе возможен только для морфологического и синтаксического уровней
Основные этапы автоматического порождения текста – это: 1) выбор нужной информации из базы знаний; 2) составление плана текста и выбор стиля; 3) выдача ответа на определенный запрос пользователя; 4) непосредственное порождение последовательности предложений; 5) изложение краткого содержания текста; 6) описание тематики текста через набор ключевых слов
   -> 1,2,4
   1,2,5,6
   3,4
   1,5,6
Отражение всех аспектов содержания анализируемого текста описывается параметром
   -> полноты индексирования
   точности индексирования
   широты используемых терминов
   полноты поиска
Оценка компьютерного реферата «изнутри» – это оценка: 1) того, насколько реферат отражает основные идеи оригинала; 2) связности реферата; 3) длины реферата; 4) того, насколько реферат полезен для определенных целей; 5) выразительности реферата; 6) стоимости реферата
   -> 1,2
   3,4
   3,6
   5,6
Оценка реферата «извне» – это оценка: 1) того, насколько реферат отражает основные идеи оригинала; 2) связности реферата; 3) длины реферата; 4) того, насколько реферат полезен для определенных целей; 5) выразительности реферата; 6) стоимости реферата
   -> 4
   1,2
   6
   3,5
Представление системы в виде связанных между собою блоков, отвечающих за определенные типы операций, называется
   -> архитектурой
   модулем
   синтезом
   системой ПОЭТ
При определении основы слова в английском языке в процессе морфологического анализа система должна: 1) попытаться отсечь у слова суффикс максимально возможной длины; 2) выделить в слове как можно больше суффиксов; 3) учитывать контекстные правила, запрещающие выделение суффиксов в некоторых словах; 4) учитывать правила орфографии для получения основы стандартного вида; 5) действовать только на основе базового правила
   -> 1,3,4
   3,4,5
   1,3,5
   2,3,5
Приписывание тексту набора ключевых слов, отражающих его содержание, называется
   -> индексированием
   поисковым образом текста
   структурированием текстовой информации
   автоматической обработкой письменного текста
Разложение получаемой системой на вход информации на базовые составные элементы называется
   -> анализом
   синтезом
   автоматической обработкой
   компьютерной обработкой
Результатом индексирования является
   -> поисковый образ документа в виде набора ключевых слов
   набор объективных дескрипторов
   структурированная база данных
   обработка пользовательского запроса
Речевые технологии могут быть использованы для: 1) создания устройств устного ввода/вывода информации; 2) усовершенствования систем обработки письменного текста; 3) организации автоматических информационно-справочных служб, обрабатывающих устные запросы; 4) создания систем речевого управления техникой; 5) создания систем интеллектуальной обработки данных; 6) разработки приспособлений, помогающих инвалидам
   -> 1,3,4,6
   2,3,4,5
   2,3,4,6
   1,3,5,6
Синтаксический анализ нужен для решения следующих задач: разрешение морфологической омонимии; разрешение лексико-семантической омонимии; 1) выделение связных словосочетаний; 2) членение текста на слова; 3) определение значимости слов на основе синтаксических ролей; 4) выявление в предложении предикатно-аргументных отношений
   -> 1,3,5,6
   1,2,5,6
   3,4,5,6
   1,2,3,5
Синтез – это
   -> объединение или преобразование единиц более низкого уровня в единицы более высокого
   сегментация на составные части
   использование определенного набора элементарных составляющих
   обработка определенного вида информации
Синтезаторы «текст-речь»
   -> имитируют деятельность человека по озвучиванию текста любой сложности
   осуществляют спектрально-временной анализ речевого сигнала
   могут синтезировать звуки только на основе хранящихся в памяти компьютера фрагментов
   это системы морфологического синтеза
Система, распознающая в потоке речи ее смысловые элементы, называется
   -> анализатором звучащей речи
   спектрограммой
   осциллографом
   вокодером
Системы автоматической классификации могут: 1) классифицировать набор документов по определенным рубрикам; 2) приписывать рубрикам определенный набор ключевых слов; 3) выделять рубрики на основании анализа входного потока документов; 4) распределять документы на кластеры в зависимости от близости их содержания; 5) находить эталонные документы, представляющие ту или иную рубрику
   -> 1,3,4
   2,5
   1,3,5
   2,4
Системы морфологического анализа призваны решать следующие задачи: 1) определение всех грамматических характеристик слова (часть речи, род, число, падеж, одушевленность, спряжение и т.п.); 2) определение словарных эквивалентов слова на другом языке; 3) получение всех грамматических форм слова; 4) построение дерева синтаксических зависимостей; 5) разрешение лексической неоднозначности; 6) приведение различных грамматических форм слова к словарной форме
   -> 1,3,6
   2,3,6
   1,3,5,6
   2,4
Составление компьютером реферата в форме краткого изложения возможно только при наличии
   -> системы знаний, близкой к человеческой
   мощного процессора
   развитой методики индексирования
   новых статистических технологий реферирования
Существует два основных подхода к автоматическому аннотированию: 1) статистический; 2) физико-акустический; 3) динамический; 4) подход с опорой на знания; 5) генеративный; 6) редукционный
   -> 1,4
   2,5
   3,6
   1,5
Существует два основных подхода к составлению краткого изложения: 1) манипуляции с синтактико-семантическим деревом; 2) генерация изложения статистическими методами; 3) составление риторической структуры текста; 4) составление краткого изложения из предварительно полученных выдержек; 5) составление концептуальной структуры текста
   -> 1,5
   2,5
   3,5
   4,5
Существует два основных типа синтезаторов «текст-речь» 1) коартикуляционные; 2) формантные; 3) акустико-просодические; 4) конкатенативные; 5) параметрические
   -> 2,4
   3,5
   2,5
   1,3
Существуют следующие основные подходы к декодированию языковой структуры речевого сообщения: 1) использование лингвистических знаний; 2) использование статистических методов; 3) использование физико-акустических методов; 4) сравнение с эталонными образцами
   -> 1,2
   3,4
   1,3
   2,4
Трифон – это
   -> контекстная реализация фонемы
   последовательность из трех фонем
   последовательность морфем
   то же самое, что триграм
Установите правильную последовательность процесса порождения текста: 1) модуль организации дискурса разбивает информацию на предложения в соответствии с инструкциями; 2) в зависимости от назначения текста берутся фрагменты информации из базы данных или знаний; 3) модуль порождения предложений организует абзацы и предложения внутри них в соответствии с определенными правилами; 4) модуль решения задач формирует план и стиль текста, а также инструкции по организации информации в соответствии с планом и стилем; 5) получение выходного текста
   -> 2-4-1-3-5
   2-3-4-1-5
   5-1-2-4-3
   1-5-2-3-4
Установите соответствия
   -> 1-d, 2- c, 3- b, 4- a
   1-d, 2-c, 3-e, 4-a
   1-c, 2-d, 3-e, 4-a
   1-b, 2-a, 3-c, 4-d
Установите соответствия:
   -> 1-e, 2-d, 3-c, 4-b
   1-d, 2-a, 3-c, 4-e
   1-b, 2-d, 3-a, 4-e
   1-e, 2-c, 3-b, 4-a
Устройства, предназначенные для преобразования кодовой последовательности, поступающей с компьютера, в непрерывный речевой сигнал, называются
   -> синтезаторами звучащей речи;
   вокодерами Дадли
   машинами Кранценштайна
   анализаторами звучащей речи
Фонетические модели в статистических системах распознавания речи задают ограничения на
   -> возможные последовательности трифонов
   возможные последовательности слов
   возможные сочетания акустических признаков
   возможности построения предложений
Формула wij = tfij log(N/dfj) приписывания веса индексным терминам учитывает: 1) частоту слова в документе; 2) ранг слова; 3) вероятность встретить слово в документе; 4) количество документов в базе, содержащих данное слово; 5) количество индексных терминов; 6) входит ли слово в стоп-список
   -> 1,4
   2,3
   5,6
   3,5
Формула, соответствующая первому закону Ципфа, – это
   -> С = (Частота вхождения слова х Ранг частоты) / Число слов
   Вероятность = Частота вхождения слова / Общее число слов в тексте
   равносторонняя гипербола
   Вероятность = (Частота вхождения слова Ранг частоты) / Число слов