ИСТОРИЯ
НОРМАТИВНЫЕ АКТЫ

П.Н. Афонин. «Информационные таможенные технологии»

Как уже отмечалось, в ПОД и ПП отражается лишь основное смысловое содержание поступающих сообщений в сокращенном виде. Поэтому метод информационного поиска, основанный на сопоставлении ПП с ПОД, не в состоянии полностью обеспечить отыскание всех документов, отвечающих информационному запросу. Это приводит к тому, что часть документов, отвечающих запросу, т. е. релевантных ему, остается невыданной потребителю. В то же время во множестве выданных ему документов присутствуют и такие, которые не отвечают запросу, т. е. не являются релевантными. Таким образом, практически любой реальной ДИПС присущи два основных типа ошибок:

• ошибки 1-го рода (или пропуск цели): невыдача потребителю фактически релевантных его запросу документов;
• ошибки 2-го рода (или ложная тревога, иначе шум): выдача потребителю нерелевантных документов, которые не отвечают поставленному запросу.

Наличие ошибок 1-го и 2-го рода в реальной системе обусловливает разбиение всего массива документов системы по отношению к запросу на 4 подмассива.

Разбиение массива документов
Выданные Невиданные
Релевантные A C
Нерелевантные B D

A — массив выданных релевантных документов; B — массив выданных нерелевантных документов; C — массив невиданных релевантных документов; D — массив невиданных нерелевантных документов.

Введем следующие обозначения; a — количество выданных релевантных документов; b — количество выданных нерелевантных документов; с — количество невиданных релевантных документов; d — количество невиданных нерелевантных документов.

Существуют следующие показатели эффективности ДИПС.

1. Коэффициент полноты p, характеризующий долю выданных релевантных документов во всем массиве релевантных документов:

p = a / (a + c).

2. Коэффициент точности n, характеризующий долю выданных релевантных документов во всем массиве выданных документов:

n = a / (a + b).

Например, если по запросу «Красная площадь» находится 150 документов, в 70 из них содержится словосочетание «Красная площадь», а в остальных просто присутствуют слова («красная машина начальника таможенного поста проехала через площадь»), то точность поиска считается равной 70/150.

3. Коэффициент шума e, характеризующий долю выданных нерелевантных документов во всем массиве выданных документов:

e = b / (a + b) = 1 - n.

4. Коэффициент осадка q, характеризующий долю выданных нерелевантных документов во всем массиве нерелевантных документов:

q = b / (b + d).

5. Коэффициент специфичности k, характеризующий долю невыданных нерелевантных документов во всем массиве нерелевантных документов:

K = d / (b + d).

Часто для удобства перечисленные показатели измеряют в процентах, т. е. в указанных формулах появляется дополнительный сомножитель 100%.

При оценке качества реальных систем наиболее часто используются лишь коэффициенты полноты и точности. Ясно, что и точность поиска, и его полнота зависят не только от свойств поисковой системы, но и от правильности построения конкретного запроса, а также от субъективного представления пользователя о том, что такое нужная ему информация. Однако при желании можно вычислить и средние значения полноты и точности для конкретной системы, протестировав ее на эталонной базе документов. Очевидно, хорошая поисковая система должна иметь как можно большие полноту и точность, желательно — 100%, т. е. находить все нужные документы и ни одного лишнего. Однако стопроцентное качество поиска невозможно, потому что на фиксированном уровне мощности поискового средства все попытки улучшить один из этих параметров приводят к ухудшению другого (рис. 51).

Наряду с перечисленными показателями, которые основаны на сопряженности релевантности и выдачи, целесообразно использовать также и другие показатели эффективности, что обычно и делается на практике. К основным из них следует отнести:

• быстродействие ДИПС (интервал времени между моментом формулировки запроса и получением ответа на него);
• пропускную способность (оценивается количеством вводимых документов и количеством ответов в единицу времени при заданных значениях коэффициентов полноты и точности);
• производительность (оценивается количеством пользователей системы и частотой обращения с их стороны);
• надежность работы (оценивается вероятностью того, что система будет выполнять свои функции при заданных условиях в течение требуемого времени);
• тип запросов, обслуживаемых системой.

Вопросы для самоконтроля

1. Что представляет собой база данных?

2. В чем различия иерархической, сетевой и реляционной моделей данных?

3. Что такое СУБД и какие основные функции она предоставляет пользователю и программисту?

4. Что такое центральная база данных ЕАИС? Каким нормативным документом введено это понятие?

5. Как осуществляется заполнение центральной базы данных ТД?

6. Какие основные термины определил Приказ ГТК от 12.05.2003 г. «О порядке сбора, проведения форматно-логического контроля и передачи электронных копий грузовых таможенных деклараций»?

7. В чем заключается суть распределенной технологии обработки и хранения данных?

8. В чем отличие распределенной обработки данных от распределенного хранения данных?

9. Каковы принципы построения систем, ориентированных на анализ данных?

10. Что такое хранилища данных?

11. Какие модели используются для построения хранилищ данных?

12. Какова логическая схема системы поддержки принятия решения, использующая хранилища данных и витрины данных?

13. Какие используются методы для аналитической обработки данных в хранилище?

14. Какова роль хранилищ данных в ЕАИС?

15. Каковы особенности использования OLAP-технологии при формировании таможенной статистики?

16. Что такое CASE-технологии и какова их роль при проектировании информационных таможенных систем?

17. В чем отличие документальных информационно-поисковых систем от традиционных фактографических баз данных?

18. Как функционируют документальные информационно-поисковые системы?

19. Каковы проблемы формального представления смыслового содержания текста?

20. В чем отличия классификационных информационно-поисковых языков от дескрипторных?

21. Какие модели используются для поиска текстовой информации?

22. Какие существуют показатели эффективности документальных информационно-поисковых систем?

ГЛАВА 5. ПРОГРАММНЫЕ ПРОДУКТЫ, ИСПОЛЬЗУЕМЫЕ В ФТС РОССИИ. ФУНКЦИОНАЛЬНЫЕ АВТОМАТИЗИРОВАННЫЕ РАБОЧИЕ МЕСТА

5.1. СРЕДСТВА АВТОМАТИЗАЦИИ ОРГАНОВ УПРАВЛЕНИЯ ФТС

Автоматизация таможенных технологий должна сводить к минимуму негативное влияние «человеческого фактора» в принятии каждого конкретного решения путем применения информационно-технических средств, интегрированных в единую систему оперативного управления таможенной деятельностью.

Основными таможенными технологиями, требующими комплексной автоматизации, являются следующие технологии:

• таможенного контроля в торговом и неторговом обороте;
• контроля доставки товаров;
• ведения таможенной статистики внешней торговли России, формирования данных для официальных публикаций и информационного обеспечения федеральных и местных органов власти данными таможенной статистики внешней торговли;
• прохождения таможенных платежей;
• таможенно-банковского валютного контроля поступления валютной выручки от экспорта товаров и обоснованности платежей в иностранной валюте;
• контроля соблюдения мер нетарифного регулирования внешнеэкономической деятельности;
• контроля внешнеторговых бартерных сделок;
• контроля исполнения постановлений таможенных органов;
• круглосуточного анализа деятельности и контроля состояния таможенных органов оперативно-дежурными службами ФТС России, региональных таможенных управлений и таможен;
• информационной поддержки деятельности правоохранительных подразделений таможенных органов.

Важным является совершенствование технологий обеспечивающего комплекса, в том числе:

• контроля делопроизводства и исполнения в таможенной службе постановлений и поручений Правительства Российской Федерации, решений руководства ФТС России;
• обеспечения финансово-хозяйственной деятельности таможенных органов;
• кадрового обеспечения деятельности таможенных органов;
• приема, передачи, хранения и представления данных оперативной и нормативно-справочной информации на различных уровнях организационной структуры таможенной службы Российской Федерации;
• обеспечения администрирования данных и процессов в автоматизированных системах таможенных органов;
• обеспечения функционирования и администрирования Ведомственной интегрированной телекоммуникационной сети и ведомственной электронной почты;
• обеспечения информационной безопасности таможенных органов.

Организационно-функциональная структура ЕАИС ФТС России соответствует действующей организационной структуре таможенных органов, основные компоненты которой обеспечивают автоматизацию существующих органов управления:

• автоматизированная система управления (АСУ) ФТС России;
• АСУ региональным таможенным управлением;
• АСУ таможней;
• АСУ таможенным постом.

<<   [1] ... [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] ...  [66]  >> 


Контактная информация: e-mail: info@tkod.ru   


Rambler's Top100Rambler's Top100 Яндекс цитирования Все о таможне