Ақпараттық жүйелер
Сабақтың коды Курс аты Сынып Академиялық кредит Cағат Апталық сабақ сағаттары (лекция) Апталық сабақ сағаттары (практика) Апталық сабақ сағаттары (зертханалық)
UDOSZhA 4214 Үлкен деректерді өңдеу (Big DATA) төртінші курс 5 150 1 2 2
Пәннің сипаттамасы
Түрікше
PhD, Эрай Челик

Пәннің мақсаты үлкен деректерді аналитикалық өңдеу саласындағы негізгі түсініктермен танысуға мүмкіндік береді. Курста машиналық оқыту негіздері, визуализация және үлкен деректерді сақтау баяндалады. Курстың нәтижесі бойынша студент пәндік мәселелерді үлкен деректерді өңдеу технологиясының тіліне аудара алады. Зерттеу барысында үлкен деректерді талдаудың техникалық және әдістемелік құралдары туралы түсініктер қалыптастырылады.

---

Ақпараттық жүйелердегі мәліметтер базасы

жобалау, проблемалық оқыту, топтық жұмыс, бұлттық технология, ақпараттық технология, дамыта оқыту технологиясы әдістері

1ақпараттың үлкен көлемін талдауды және деректерді басқаруды ұйымдастыруды үйренеді.
2Мәліметтерді өңдеу мен талдаудың жаңа технологияларын қолдана отырып жүзеге асырады.
3Үлкен деректер технологиясының мүмкіндіктерін ескере отырып, ұйымның ақпараттық инфрақұрылымының жаңа үлгілерін жасай алады.
4деректерді талдау саласында теориялық және практикалық аспектілерді интенсивті түрде үйренеді.
5қашықтықтағы деректер базасы мен ақпараттық жүйелердің әр түрлі компоненттерін әзірлеу және жобалай алады.
Haftalık KonuБағалау әдісі
1Үлкен деректерге сипаттама. Улкен деректердің маңызы.
2Үлкен деректер құралдары және олардың функциясы
3Дистрибутивтар жайлы негізгі деректер. Apache, Cloudera, Horton Works артықшылықтары мен айырмашылықтары
4HADOOP архитектурасы
5Платформаға сипаттама. «HADOOP» экожүйесінің компоненттері
6Hadoop негізгі принциптері. Hadoop компоненттері. Hadoop 2.0
7MapReduce функцияларының үлкен деректермен жұмыс істеу жолдары. MapReduce – граф түрінде алгоритмдеу.
8Hive, Pig компоненттерінің жұмыс жасау технологиясы. Компоненттерде сұрауларды орындау.
9Инфрақұрылым және құрылымдық мәліметтерді Hive арқылы құру
10Үлкен деректер шешімдерін масштабтауға арналған негіз: RDBMS, NoSQL және HBase
11Нақты деректерді қолданатын ауқымды шешімдер. MongoDB
12Деректер аналитикасы және визуализациясы. Нақты тілдерді өңдеу: Apache Kafka
13Apache Falcon және Ozie компоненттерінде шешімдер. Spark және Storm компоненттерінің жұмыс жасау технологиялары
14Машиналық оқыту кітапханасы – Mahout-тың жұмыс жасау алгоритмі. Mahout кластеризациясы
15Үлкен деректер мен жасанды интеллекттің арасындағы өзара байланысты «HADOOP» экожүйесі арқылы көрсету
Пәннің оқу нәтижелерімен байланысы
PÇ1PÇ2PÇ3PÇ4PÇ5PÇ6PÇ7PÇ8PÇ9PÇ10PÇ11PÇ12
Оқулық / Материал / Ұсынылатын ресурстар
1Исахметов Т.И., Шадиева А.А., Жаздыкбаева Д.П., Big Data технологиялар. Алматы -2022.
2A. K. Mukasheva, T. F. Umarov, I. A. Zimin, Big data analytics. Textbook, Almaty, 2022.
3Деректер қоры жүйелері Нур-Принт Алматы, 2012ж. Оқу-әдістемелік құрал
4Технологии и инфраструктура BIG DATA, И. А. Радченко, И. Н. Николаев, 2018, ИТМО, учебник, СПб.52
5Силен, Д. и др. Основы Data Science и Big Data. Python и наука о данных. / Д. Силен, А. Мейсман, М. Али.