수강 신청 전 주의 사항
1. 수강 기간
- 결제 완료일로부터 정해진 수강 기간 동안 무제한 복습 가능하며, 수강 기간이 종료된 이후에는 동영상 재생이 불가능합니다.
2. 수료증 발급
- 수강 기간 내 교육과정 진도율 100% 이수, 설문 작성을 완료하면 수료증을 발급받을 수 있습니다.
- ‘나의강의실’ > ‘증명서발급’에서 발급받을 수 있습니다.
3. 동영상 재생 기기 대수 제한
- 최초 동영상 재생 시 사용한 기기가 자동으로 등록됩니다.
- 계정당 3개의 기기(PC, 모바일, 태블릿 등 기타)까지만 등록 가능하며, 이에 대한 부주의로 인한 기기변경은 불가능합니다.
※ 중국 생산용 휴대폰기기(샤오미 등) 및 LG유플러스 홈보이 제공용 G패드 기기 등 자체 튜닝 기기는 시청이 불가할 수 있습니다.
4. 세금계산서 발급
- 세금계산서가 필요하신 분은 결제 시 무통장 입금 방식을 선택해 주시고, ‘주문요청’란에 기재해 주시기 바랍니다.
- edu@cyram.com으로 사업자등록증을 첨부, 발급받으실 이메일 주소를 기재하여 보내주시기 바랍니다.
5. 대학(원)생 할인 제도
- 전일제 대학(원)생은 수강 신청 전에 학생 증빙자료를 제출해 주시면 수강료의 40% 할인된 가격으로 수강하실 수 있습니다(할인 쿠폰 발급).
- 수강하고자 하는 교육과정명과 학생증, 재학증명서 등 현재 학생임을 증빙할 수 있는 자료를 ‘학습지원’ > ‘대학(원)생자료실’에 비공개로 올려주시기 바랍니다.
- 관리자가 증빙자료를 확인하고 할인 쿠폰을 발급할 때까지 영업일 기준 1~2일 소요될 수 있습니다.
- 1년 이상 과거 시점의 재학증명서 또는 수료증명서, 학위증 등은 대학(원)생 할인을 받으실 수 없습니다.
무엇을 배우나요?
• Python 언어를 이용하여 소셜 빅데이터를 수집하고 분석하기 위한 문법
• 소셜 빅데이터 수집 방법 – 웹크로울링, API를 이용한 수집
• 소셜 빅데이터 분석 방법 – 텍스트마이닝, 소셜네트워크분석, 머신러닝
강좌 내용 및 설명
- 인문·사회과학자로서 데이터 과학자(data scientist)가 되고 싶습니까?
- 데이터를 자유자재로 다루는 경쟁력 있는 연구자가 되고 싶습니까?
- 아직 SNS 데이터를 '복사+붙여넣기'로 모으고 계십니까?
- 엑셀이 지원하지 않는 기능 때문에 고민하고 계십니까?
- 통계 패키지로 SNS 데이터를 분석하여 얻을 수 있는 것이 별로 없습니까?
• 본 과정은 빅데이터 분석에 적합한 프로그래밍 언어인 파이썬(Python)을 활용하여 웹, SNS 등 소셜 빅데이터를 직접 수집하고, 가공하고, 분석
해보는 교육 과정입니다. 파이썬 프로그래밍 실습을 ‘따라하기’ 형식으로 진행하여 프로그래밍 경험이 없는 인문, 사회과학 연구자들이 쉽게 학습
할 수 있습니다. 본 과정을 수강하시면 파이썬 습득 + 데이터 수집 + 빅데이터 분석이 모두 가능해 집니다.
"파이썬을 이용한 소셜 빅데이터 분석 기초 교육"으로 데이터 과학자가 되는 첫걸음을 떼어보세요.
• 간결하며 활용도 높은 파이썬으로 쉬운 프로그래밍 실습
• 소셜 빅데이터의 수집, 처리, 분석까지 전 과정의 기초 쌓기
• 총 교육시간 : 21시간
요구사항
• NetMiner를 연동해서 사용하는 교육 내용 포함되어 있습니다. 수강신청 후 강의실 내에서 교육용 넷마이너를 다운로드 받아서 설치해 주시기 바랍니다.
• 'II. 빅데이터 수집 및 분석 파트'에서 'API를 활용한 수집' 부분을 수강하시기 전에 준비 사항이 있습니다.
API를 이용한 데이터 수집 진행시 아래 사이트에서 수집을 진행합니다. 미리 방문해 보시고 회원가입하여 준비해주시기 바랍니다.
1. 공공데이터 포털 : data.go.kr
2. 오픈AI : platform.openai.com
• 강의 자료(교재, 실습 데이터 등) 및 교재 열람 방법은 강의실 내 [공지사항]과 [강의자료] 메뉴에서 확인하실 수 있습니다.
• 보안 정책에 따라, 담당자가 수강생의 회원 정보에 등록된 이메일 주소로 교재 열람 권한을 지정하며, 교육 과정 결제 후 1~2 영업일이 소요될 수 있습니다.
• 선수 과목 : NetMiner 소개와 기초 사용법 교육(무료)
수강 대상자
• 데이터 분석에 대한 기초적인 지식은 있으나, 프로그래밍 경험이 전혀 없는 분
• SNS 데이터를 비롯한 다양한 소셜 빅데이터 분석 관심자
• 파이썬을 쉽게 배우고 싶은 분
강사 정보
고영진 - ㈜사이람 수석연구원
1. 0) 강의소개 11분
2. 1) 프로그래밍 언어 8분
3. 2) Why Python 5분
4. 3) 파이썬 설치 9분
5. 4) 파이썬 개발환경 16분
6. 1) 변수의 의미 14분
7. 2) 기본자료형 개요 10분
8. 3) 수치형 3분
9. 4) 문자형 : i. 문자형 14분
10. 4) 문자형 : ii. 문자형 처리함수(1) 16분
11. 4) 문자형 : ii. 문자형 처리함수(2) 23분
12. 5) 불리언 2분
13. 6) 형변환 11분
14. 1) 개요 7분
15. 2) 리스트 : i. 리스트의 특징 18분
16. 2) 리스트 : ii. 리스트의 데이터 처리 22분
17. 3) 튜플 7분
18. 4) Set 14분
19. 5) 사전 19분
20. 6) 자료구조의 기타 특징(1) 19분
21. 6) 자료구조의 기타 특징(2) 17분
22. 1) 조건문 : i. 조건문 문법 23분
23. 1) 조건문 : ii. 조건문 활용 11분
24. 2) 반복문 : ⅰ. for 반복문 17분
25. 2) 반복문 : ⅱ. while 반복문 10분
26. 2) 반복문 : ⅲ. 반복문의 중첩 13분
27. 2) 반복문 : ⅳ. break/continue 12분
28. 3) 예외처리 19분
29. 1) 개요 10분
30. 2) 함수의 input, output 7분
31. 3) 함수의 return 값 19분
32. 1) 파일 읽기 : i. 파일 읽기 22분
33. 1) 파일 읽기 : ii. 파일 읽기 방식 17분
34. 2) 파일 쓰기 13분
35. [연습문제1] 조건문, 함수, 파일 입출력 32분
36. 1) 클래스의 의미 19분
37. 2) 클래스의 생성 10분
38. 3) 클래스의 호출 6분
39. 1) 모듈의 생성 10분
40. 2) 모듈의 사용 15분
41. 3) 내장모듈 35분
42. 4) 외부모듈 32분
43. [연습문제2] 내장 모듈-Random, DateTime 12분
44. 1) 빅데이터란 18분
45. 2) 개발환경 설정 10분
46. 3) 한글처리 28분
47. 4) 데이터 획득 방식의 종류 12분
48. 1) 웹 크로울링의 원리 14분
49. 2) 기본적 웹 크롤링(1) : i. parsing 34분
50. 2) 기본적 웹 크롤링(1) : ii. 데이터 획득 11분
51. 2) 기본적 웹 크롤링(2) : i. 페이징 10분
52. 2) 기본적 웹 크롤링(2) : ii. requests 활용 11분
53. 2) 기본적 웹 크롤링(2) : iii. 게시판 제목 리스트 코드 리뷰 5분
54. 3) Beautiful soup 활용 방법 29분
55. 4) 동적 웹 크롤링 : i. 동적 데이터 수집 개요 8분
56. 4) 동적 웹 크롤링 : ii. Selenium을 이용한 추가 액션(1) 22분
57. 4) 동적 웹 크롤링 : ii. Selenium을 이용한 추가 액션(2) 14분
58. 1) API를 이용한 데이터 획득 22분
59. 2) API를 이용한 데이터 수집 : i. arxiv 21분
60. 2) API를 이용한 데이터 수집 : ii. 공공데이터포털 23분
61. 2) API를 이용한 데이터 수집 : iii. openai 17분
62. 1) 개요 5분
63. 2) 형태소 분석 34분
64. 3) 데이터 구조화 : i. 문서 데이터 구조화 24분
65. 3) 데이터 구조화 : ii. 관계 데이터 구조화 23분
66. 4) NetMiner 데이터 입력 16분
67. 1) 단어빈도 분석 : i. 전체 단어 빈도 분석 26분
68. 1) 단어빈도 분석 : ii. 게시물 제목의 단어 빈도 실습 37분
69. 2) 문서별 핵심단어 분석 : i. TF-IDF 원리 8분
70. 2) 문서별 핵심단어 분석 : ii. TF-IDF 실습 42분
71. 2) 문서별 핵심단어 분석 : iii. TF-IDF 분석 시나리오 6분
72. 1) 네트워크 분석 개요 12분
73. 2) 소셜 네트워크 영향력 분석 실습 - 공저자 네트워크 분석 12분
74. 1) 단어 간 연관성 분석 : ⅰ. word2vec 원리 16분
75. 1) 단어 간 연관성 분석 : ⅱ. word2vec 실습코드와 활용분야 31분
76. 1) 단어 간 연관성 분석 : ⅲ. FASTTEXT와 word2vec 비교 및 실습 3분
77. 2) 토픽 모델링, LDA 16분