Технология обработки, визуализации и анализ данных После того, как в программу был совершен импорт данных, начинается процесс обработки и визуализации данных. Данные процессы имеют непосредственную взаимосвязь, так как ещё на стадии импорта данных выбирается способ их отображения, затем данные автоматически обрабатываются и выводятся на экран. Визуализация данных проходит с помощью «Мастера визуализаций» (рис.11)  Рисунок 11 – Мастер визуализаций Последним пунктом «Мастера визуализации» является обработка данных (рис.12)  Рисунок 12 – Успешное завершение работы мастера визуализации данных На начальном этапе данные были отражены в виде таблицы (рис.13), диаграммы (рис.14) и гистограммы (рис.15).  Рисунок 13 – Таблица значения урожайности подсолнечника Из рис.13 можно увидеть данные урожайности подсолнечника по годам за период 1991-2011 годов.  Рисунок 14 – Диаграмма значений урожайности подсолнечника На рис.14 наглядно представлена урожайность культуры по годам. Можно заметить, что наибольший показатель урожайности наблюдался в 2011 году, а наименьший в 2001 году. Используя диаграмму, можно просматривать имеющиеся данные по годам: подведением курсора к интересующему году и нажатием на него.  Рисунок 15- Гистограмма значений урожайности подсолнечника На рис.15 также наглядно представлены значения урожайности, но в отличие от диаграммы по оси Y откладываются не сами года, а их количество в той или иной интервальной группе. По оси Х откладываются интервалы урожайности. Анализируя гистограмму, следует отметить, что за 21 год исследования, значений низкой урожайности подсолнечника (1996, 1997, 1998, 1999,2001,2010 года) больше, чем высокой (2005, 2008, 2011 года). Затем, сделаем прогноз урожайности подсолнечника, используя нейросеть и линейную регрессию. Нейросеть – это математическая модель, использующаяся для прогнозирования, в данном случае, экономической информации. Она имеет входные, скрытые и выходные нейроны. Входными нейронами являются анализируемые годы, а выходными урожайность культуры (рис.16).  Рисунок 16 – Граф нейросети Помимо, графика нейросети в модели нейросети были рассмотрены следующие визуализаторы: диаграмма рассеяния, «что-если», статистика.  Рисунок 17 – Визуализатор «что-если» На рис.17 представлен визуализатор «что-если», в котором отображены значения урожайности в зависимости от входных данных.  Рисунок 18 – Визуализатор статистика На рис.18 представлен визуализатор статистика, с помощью которого наглядно представлена частота встречаемости признака в зависимости его от диапазона.  Рисунок 19 – Диаграмма рассеяния в нейросети Диаграмма рассеяния представлена на рис.19. Из неё следует, что при вероятности ошибки 5% большинство значений урожайности подсолнечника не выходят за предельный интервал. Далее составим прогноз по нейросети (рис.20).  Рисунок 20 – Прогноз урожайности подсолнечника по нейросети Перейдём к анализу линейной регрессии, которая является статистическим методом исследования зависимости одних показателей от других. Были рассмотрены следующие визуализаторы: диаграмма рассеяния (рис.21), «что-если» (результат аналогичен результату нейросети).  Рисунок 21 – Диаграмма рассеяния в линейной регрессии Сравнив рис.21 и рис.19, можно сказать о том, что линейная регрессия позволяет учитывать больше значений, чем нейросеть, так как в данном случае количество результатов, вышедших за пределы интервалов, ниже. Далее составим прогноз по линейной регрессии (рис.22).  Рисунок 22 – Прогноз урожайности подсолнечника по линейной регрессии Сравним прогнозы урожайности подсолнечника между собой и с фактическим значением (таб.1). Таблица 1- Сравнительный анализ прогнозов урожайности Прогноз | Числовые данные урожайности, ц/га | В нейронной сети | 11,801 | Линейная регрессия | 12,740 | Фактическое значение | 13,000 | Из таблицы видно, что модель линейной регрессии позволила получить данные, более приближенные к фактическим. При использовании линейной регрессии, прогнозное значение урожайности отличается от фактического не более, чем на 2%. При использовании нейронной сети значения урожайности отличаются не более, чем на 10% (не входит в доверительный интервал). Таким образом, модель нейросети, в отличие от модели линейной регрессии, нельзя использовать для качественного и наиболее точного прогнозирования урожайности подсолнечника. Заключение В современных условиях жесткой рыночной конкуренции для каждого предприятия важно качественное стратегическое управление, которое не возможно без прогнозирования рыночной ситуации. В данных ситуациях многие используют Системы поддержки и принятия управленческих решений (СППР), наиболее популярна из них СППР Deductor. Именно эта АИС была использована в данной работе для прогнозирования урожайности подсолнечника в РФ. Результатом работы стали следующие выводы (исходя из задач проекта): · Функциональные подсистемы АИС состоят из комплексов задач, характеризующихся определенным экономическим содержанием, достижением конкретной цели, которую должна обеспечить функция управления. Для их построения необходимо соблюдать принципы: принцип системности, развития, стандартизации, первого руководителя, новых задач, автоматизации и другие. · Deductor является аналитической платформой - основой для создания законченных прикладных решений в области анализа данных. СППР Deductor может решать практически любые задачи, связанные с консолидацией данных, их отображением различными способами. · Реализованные в Deductor технологии (Data Warehouse, OLAP, Data Mining, KDD) позволяют на базе единой архитектуры пройти все этапы построения аналитической системы от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов. · Сбор данных и их обработка (площадь посева, валовый сбор, урожайность) осуществляется с помощью ETL-процессов, дальнейшая их обработка и анализ - Data Mining, KDD-технологий. Таким образом, СППР Deductor помогает в принятии наиболее целесообразных решений для любого предприятия, так как технологии «зашитые» в данной АИС помогают достаточно точно спрогнозировать рыночную ситуацию и наглядно представить её. Так в курсовой работе для прогнозирования урожайности подсолнечника в РФ были построены прогнозы на основе нейросети и линейной регрессии, проанализировав которые, необходимо отметить, что для точного и качественного анализа показателей урожайности лучше всего использовать модель линейной регрессии, так как полученные значения не отличаются от фактических более, чем на 5% (входят в доверительный интервал). 12.12.2013 Библиографический список 1. Карпузова В.И., Скрипченко Э.Н., Чернышева К.В. Автоматизированные информационные технологии в экономике (Использование типовых проектных решений в АПК): Учебное пособие/ В.И. Карпузова, Э.Н. Скрипченко, К.В. Чернышева. М.: Изд-во РГАУ – МСХА имени К.А. Тимирязева, 2011. 336с. 2. ФЗ РФ от 27 июля 2006 г. N 149-ФЗ 3. www.abc.org.ru -Компания ABC Consulting 4. www.basegroup.ru – Компания BaseGroup Labs 5. www.chaliev.ru – Персональный сайт Чалиева А.А. (Лекции по информационным системам в экономике для заочного отделения) 6. www.wikipedia.org – Википедия 7. Материалы лекций [1] АИС -совокупность содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств (ФЗ РФ от 27 июля 2006 г. N 149-ФЗ) [2] BaseGroup Labs создана 22 ноября 1995 года в Рязани и первоначально занималась созданием заказного программного обеспечения. [3] Был использован в курсовой работе для анализа данных [4] Федеральный закон Российской Федерации от 27 июля 2006 г. N 149-ФЗ |