Аналитика в SPSS: от новичка до уверенного бизнес-пользователя [stepik] [Никита Сергеев]

Огромная база актуальных инфопродуктов
Самый большой склад обучающих материалов в СНГ. Более 40000 уникальных курсов, схем заработка, книг, вебинаров, мануалов, тренингов
Получить доступ

Bot

Администратор
Команда форума
23 Янв 2020
138,639
750
113
1. Слово автора
2. Просто зашли поинтересоваться ради интереса?
3. Предупреждение
4. Как мы будем учиться
1. Вступление к разделу
2. Описательная и аналитическая статистика
3. Важность моделей в аналитике
4. Без модели: разведочный анализ данных (РАД) и Data Mining
5. Выборка и генеральная совокупность
6. Массив данных
7. Объекты анализа (строки)
8. Переменные\характеристики
9. Типы шкал для переменных
10. Тип данных для значений переменных
11. Требования к записи значений в массиве
12. Задание: Целостное осознание массива
13. Понятие статистической гипотезы
14. Вероятность ошибки и уровень значимости
15. Нормальное распределение
16. Параметрика и непараметрика
17. Функциональные и вероятностные взаимосвязи
18. Процесс анализа данных в организации
19. Итоги раздела
20. Тестирование по итогам раздела (часть 1)
21. Тестирование по итогам раздела (часть 2)

1. Задание: Подготовка рабочего пространства
2. Основные элементы интерфейса SPSS
3. Закладка\представление ДАННЫЕ
4. Закладка\представление ПЕРЕМЕННЫЕ
5. Элемент-невидимка: КОНТЕКСТНОЕ МЕНЮ
6. ЛЕНТА: главная управляющая часть (+панель быстрого доcтупа)
7. Окно вывода результатов анализа: ВЫВОД\Output
8. Свой собственный язык: окно СИНТАКСИСА
9. Итоги раздела
10. Тест «Интерфейс»
11. Задание: Познакомиться с интерфейсом собственноручно

1. Вступление к разделу
2. Ввод переменных: создание паспорта массива
3. Ввод данных: значения переменных
4. Суть подготовки данных к анализу
5. Суть анализа данных
6. Суть визуализации данных
7. Экспорт результатов анализа
8. Итоги раздела

1. Вступление
2. Извлечение и загрузка данных: чтение и импорт
3. Редактирование переменных
4. Упорядочивание переменных
5. Удаление переменных (столбцов)
6. Отображение значений переменных
7. Фильтрация\отбор наблюдений (строк) для анализа
8. Расщепление массива: автоматич.отбор наблюдений (виртуал.группы)
9. Сортировка наблюдений (строк)
10. Удаление строк
11. Обнаружение и чистка дубликатов
12. Обнаружение ошибок ввода и работа с ними
13. Обнаружение ошибок ввода смысловым способом
14. О работе с пропущенными значениями
15. Пропущенные значения: наблюдения\случаи\объекты (строки)
16. Пропущенные значения: переменные (столбцы)
17. Обзор спецметодов работы с "пропусками"
18. Валидация (проверка) данных
19. Добавление новых переменных (столбцов)
20. Переменная со значениями-агрегатами
21. Перекодировка переменных
22. Разбиение значений переменной на группы
23. Вычисление новых переменных по формуле\выражению
24. Вычисление переменной: подсчет количества определенных значений
25. Вычисление переменной с рангами объектов\наблюдений
26. Множественные ответы: виртуальная переменная
27. Транспонирование массива
28. Взвешивание наблюдений: работа с агрегированным массивом
29. Взвешивание наблюдений\случаев: ремонт выборки
30. Слияние массивов: добавить наблюдения\объекты анализа
31. Слияние массивов: добавить переменные
32. Экспорт данных (массива) из SPSS в другие форматы
33. Итоги раздела

1. Суть описательных статистик
2. Частотный анализ (частотное распределение)
3. Частоты под несколько переменных: таблицы сопряженности
4. Частоты для множественных ответов\выбора
5. TURF-анализ
5. 4 группы мер в описательной статистике
7. Меры центральной тенденции: среднее, мода, медиана
8. Меры точек относительного разделения: процентили и квартили
9. Выбросы
10. Меры рассеивания\вариативности\изменчивости
11. Ящик с усами:визуал среднего, квартилей, мин и макс, выбросов...
12. Меры формы распределения: асимметрия и эксцесс
13. Доппроверка нормальности распределения: P-P и Q-Q диаграммы
14. Комплексный обзор данных (Data Explore)
15. Метрики\соотношения (Ratio)
16. Настраиваемые сводные таблицы\отчеты (custom tables)
17. Визуализации: диаграммы
18. Итоги раздела

1. Отличие от описательной статистики
2. 3+1 основных блока аналитических задач
3. Возвращение к истокам: модель, РАД и Data Mining
4. Возвращение к истокам: гипотезы, вероятность ошибки и значимость
5. Проверка распределения переменных на соотв.нормальному распред.
6. Итоги раздела

1. Для чего это применяется?
2. Снова параметрика и непараметрика
3. Еще раз о значимости различий между группами
4. Зависимые (парные, связанные) и независимые выборки
5. Базовый инструмент сравнения: таблицы сопряженности и Хи-квадрат
6. Сравнение 2 независимых групп (выборок): Т-тест, параметрика
7. Сравнение 2-х независимых групп (выборок): непараметрика
8. Много незав. выборок:однофакторный дисперсионный анализ ANOVA
9. Сравнение множества независимых групп (выборок): непараметрика
10. Сравнение групп при анализе пропущенных значений
11. Сравнение 2-х парных (связанных) групп/выборок: Т-тест, парамет.
12. Сравнение 2-х парных (связанных) групп/выборок: непараметрика
13. Сравнение множества парных выборок
14. Итоги раздела

1. Одновыборочные сравнительные тесты
2. T-тест для средних (параметрика)
3. Общий обзор окна с одновыборочными тестами для непараметрики
4. Биномиальный тест (непараметрика)
5. Хи-квадрат тест (непараметрика)
6. Тестирование формы распределения (непараметрика)
7. Знаковый (медианный) тест Уилкоксона
8. Случайна или нет последовательность значений (непараметрика)
9. Итоги раздела

1. Причинно-следств. связь, а также зависимые и независ. переменные
2. Рассуждения о связях между переменными
3. И еще раз о том, что такое значимая статистическая взаимосвязь
4. Суть корреляции переменных
5. Снова таблицы сопряженности: только для проверки связи
6. Проверка формы связи
7. Корреляционный анализ: сила, направление, значимость
8. Работа с ложными корреляциями
9. Суть регрессионного анализа
10. Подгонка кривых
11. Линейная регрессия
12. Нелинейная регрессия
13. Квантильная регрессия
14. Анализ выживаемости: регрессия Кокса
15. Факторный анализ
16. Анализ надежности-согласованности (пригодности)
17. Многомерное шкалирование
18. Итоги раздела поиска скрытых взаимосвязей между переменными

1. Для чего это применяется?
2. Логистическая регрессия
3. Полиномиальная логистическая регрессия
4. Порядковая регрессия
5. Пробит-анализ
6. Суть кластеризации
7. Двухэтапный кластерный анализ
8. Кластерный анализ методом К-средних
9. Дискриминантный анализ
10. Деревья решений\классификации
11. ROC-классификатор (Receiver Operating Characteristic)
12. Нейронные сети: многослойный перцептрон (MLP)
13. Итоги классификации с "высоты птичьего полета"

1. Вступление, предназначение и оговорки о предметной области
2. Главная ловушка при прогнозировании во времени
3. Основные задачи анализа временных рядов
4. Компоненты временных рядов: тренд, сезонность, цикл, всплеск
5. Отправная точка анализа трендов:посмотреть на график "на глазок"
6. Анализ временного ряда: линия тренда с прогнозом и "коридор"
7. "Проявление" тренда с помощью скользящего среднего
8. Сезонная декомпозиция
9. Авто- и кросскорреляции
10. Итоги раздела

1. Что такое синтаксис и чем может быть полезен бизнес-пользователю
2. Открытие, наполнение, запуск и сохранение окна синтаксиса
3. Переименование и удаление переменных (RENAME и DELETE)
4. Вычисление переменных (COMPUTE)
5. Условные операторы IF, AND и OR
6. Перекодировка переменных (RECODE с TO, INTO и ELSE)
7. Основные функции-агрегаторы (SUM, MEAN, COUNT, MIN, MAX)
8. Частоты (FREQUENCIES, CROSSTABS)
9. Корреляция с WITH
10. Комментарии в синтаксисе(* или /*)
11. Зачем забирать синтаксис прямо из пользовательского интерфейса?
12. Итоги раздела

1. Проверка стабильности и надежности моделей: Bootstrapping
2. Байесовская вероятность и статистика
3. Как быстро "найти менюшки" в SPSS
4. Структурное моделирование
5. Публикация результатов анализа на Web: CDSR
6. Создание и поставка моделей: SPSS Modeler и Watson Studio
7. Итоги раздела

1. Коротко о курсе для обобщения
2. Послесловие
3. Бонус-лекция