인공지능의 발전에 따라 별도의 코딩 없이 데이터를 분석하는 No Code, Low Code의 시대로 전환되어 가고 있다. 이러한 흐름에 따라 저자는 데이터 과학 분야의 전문가들이 아닌, 입문자 및 비전공자 등 일반인도 쉽고 빠르게 실무에서 바로 사용할 수 있는 데이터 분석의 새로운 방법을 이 책에 소개하였다.
제1장. [데이터 과학을 위한 체계]에서는 데이터 과학에 접근하는 방법을 소개한다. 여기서는 데이터 과학에 접근하는 다양한 관점과 이 책에서 채택하는 프레임워크에 대해 설명한다.
제2장. [데이터 과학을 위한 도구]에서는 데이터 과학에 활용 가능한 여러 도구를 소개하고, 이 책의 실습 도구인 SAS Ⓡ OnDemand for Academics에 대하여 설명한다.
제3장. [데이터 가공과 처리]에서는 획득한 데이터를 실제 분석이 가능한 데이터로 가공 및 처리하기 위한 방법에 대하여 학습한다.
제4장. [기술적 데이터 분석]에서는 데이터를 정리 및 요약하는 과정을 통해 데이터가 가진 특성을 파악하는 방법에 대해 다룬다.
제5장과 6장. [시각적 데이터 분석Ⅰ,Ⅱ]에서는 그래프나 지도와 같은 시각화 도구를 활용하여 데이터를 분석하고 그 결과를 어떤 식으로 활용하는지, 또 어떻게 이해해야 하는지에 대한 방법을 학습한다.
그간 출간된 다양한 도서들은 저자들이 아는 것을 당연히 독자들도 알고 있으리라 짐작하기 때문에 데이터 과학의 프레임워크를 설명하는 부분에 있어 인색하였다. 하지만 이 책은 프로그래밍에 대한 이해가 전혀 없는 독자들도 쉽게 이해하고, 따라할 수 있도록 특정 학문에 치우치거나 개별 방법론에 매몰되지 않고, 보다 거시적인 안목에서 데이터 과학의 프레임워크를 제공하고 있다. 따라서 데이터 과학, 프로그래밍, 인공지능 등에 관심이 있는 독자, 특히 이 분야에 관심이 있지만 사전 지식 등이 없는 독자에게 많은 도움이 될 것이다.
■ 출판사 서평
인공지능의 발전이 가져온 노 코딩 분석 소프트웨어의 등장!
이제 누구든지 데이터 과학자가 될 수 있다!
인공지능의 발전과 함께 코딩은 필수가 아닌, 하나의 도구가 되어 가고 있다. 따라서 더 이상 파이썬이나 R과 같은 프로그래밍 언어의 문법을 배우면서 데이터 학습을 하는 것이 아닌, 인공지능 기술에 기반하여 잘 만들어진 도구를 이용해 데이터 과학의 프레임워크를 이해하고, 바로 실무에 데이터 분석 기법을 활용하는 것이 가능해졌다. 이 책에서는 데이터 과학을 접근함에 있어 중요한 것은 프로그래밍 언어나 개별 분석 방법론이 아님을 강조한다. 데이터 과학에서 가장 중요한 것은 사회 현상과 문제를 올바르게 이해하는 것이고, 이를 어떠한 분석 방법론을 통해 해결할지를 선택하는 것이다. 프로그래밍 언어를 코딩하거나 개별 분석 방법론을 적용하는 과정에서 문제가 발생한다면, 인터넷 또는 기존 도서들에 나와 있는 수많은 정보들을 활용하여 문제를 해결할 수가 있다. 하지만 다양한 언어를 습득하고 있어도 문제를 잘못 이해하여 엉뚱한 분석 방법론을 채택한다면, 이는 돌이킬 수 없는 실수가 되고 만다. 즉 데이터 과학을 위한 프레임워크를 정립하는 것이 다른 무엇보다도 중요하다.
이 책은 데이터 과학 입문자, 통계학 또는 컴퓨터공학 비전공자를 위한 도서이다. 컴퓨팅에 대한 이론적 기반을 보유하지 않은 학습자가 데이터 과학을 학습함에 있어 초행길의 길잡이와 같은 역할을 하고자 한다. 그러므로 이 책 한 권이면 어렵지 않게 데이터 과학을 이해할 수 있으며, 누구든지 데이터 과학자가 되어 훌륭한 의사결정을 할 수가 있을 것이다. 데이터 범람의 시대에서 새로운 데이터 과학의 세계로 출발해보자.
■ 추천평
이 책은 의사 결정을 하는 데 필수적인 데이터를 통한 접근법을 제시하며, 흥미로운 도구 중심 접근법으로 누구나 쉽게 데이터 과학의 세계를 이해할 수 있게 해 준다.
_홍콩과학기술대학교 컴퓨터공학과 김성훈(Sung Kim) 교수 (전 네이버 Clova AI Head / 현 업스테이지 대표이사)
코딩 없이 데이터를 분석하는 것은 인공지능이 우리에게 주는 큰 선물이다. 이 책은 프로그래밍에 대한 학습 없이 데이터 전문가로 발돋움시켜주는 지름길이 될 것이다.
_KAIST 데이터사이언스대학원 김우창 원장 (겸 KAIST 산업및시스템공학과 학과장)
초거대 AI의 등장으로 누구나 쉽게 인공지능을 사용할 수 있게 되었다. 이 책을 통해 인공지능의 핵심인 데이터 과학을 ‘누구나’, ‘더 쉽게’ 배울 수 있기를 희망한다.
_LG AI연구원 배경훈 원장 (겸 국가데이터정책위원회 산업기반분과위원장)
데이터 기반 의사 결정에 익숙하고, 통찰력을 도출하는 것은 인생 항해의 커다란 무기를 가지고 있는 것과 같다. 이 책을 통해 인생 항해의 나침반을 모두가 갖기 바란다.
_SK텔레콤 광고/Data CO 장홍성 부사장 (겸 지능정보산업협회장)
전문 도서에서 다루지 않지만, 실무에서 필수적인 데이터 가공 · 처리 · 기술적 분석을 집중적으로 다루고 있다. 비전공자 또는 데이터 과학자에게 본 교재를 적극 추천한다.
_서울대학교 산업공학과 조성준 교수 (전 공공데이터전략위원회 위원장)
코딩에 익숙하지 않은 비전공자를 위한 데이터 과학 입문서로 이 책을 적극 추천한다. 기본적인 용어들과 기법들에 익숙해지는 것만으로도 큰 도움이 될 것이다.
_KT융합기술원 AI2XL연구소 배순민 소장 (겸 대통령직속 디지털플랫폼정부위원회 AI/빅데이터분과 위원)
이 책은 데이터 과학자를 꿈꾸며, SAS Ⓡ OnDemand for Academics를 활용하고자 하는 학생들에게 훌륭한 길라잡이가 될 것이다.
_SAS Korea 이승우 대표이사
데이터가 세상을 지배하는 오늘, 데이터가 무엇이고 어떻게 활용되는지 알고 싶다면 이 책을 추천한다. 쉽게 읽을 수 있으며 기본적인 데이터 리터러시를 갖게 될 것이다.
_경인교육대학교 컴퓨터교육과 한선관 교수 (겸 한국인공지능교육학회장)
목차
■ 차례
추천의 글
머리말
1. 데이터 과학을 위한 체계
1.1. 왜 데이터 과학인가?
1.1.1. 데이터 과학이란 무엇인가?
1.1.2. 데이터 과학자의 길
1.1.3. ‘코딩 없이’ 배우는 데이터 과학의 중요성
1.2. 데이터 과학을 위한 기본 지식
1.2.1. 데이터
1.2.2. 변수
1.3. 데이터 과학의 프레임워크
1.3.1. 이론적 배경에 따른 분류
1.3.2. 분석 목적에 따른 분류
1.3.3. 종속 변수에 따른 분류
1.3.4. 변수의 개수에 따른 분류
2. 데이터 과학을 위한 도구
2.1. 데이터 과학을 위한 도구
2.1.1. 데이터 과학을 위한 도구란?
2.1.2. 오픈 소스 소프트웨어
2.1.3. 상용 소프트웨어
2.2. 왜 SAS ODA인가?
2.2.1. SAS ODA의 서비스 제공 배경
2.2.2. SAS ODA의 채택 사유
2.3. SAS ODA 사용하기
2.3.1. 권장 시스템 환경
2.3.2. 서비스 가입하기
2.4. SAS Studio 둘러보기
2.4.1. 기본 구성
2.4.2. 작업 모드
2.4.3. 프로세스 플로우
2.5. SAS Studio 맛보기
2.5.1. 폴더 만들기
2.5.2. 라이브러리 만들기
2.5.3. 작업 및 유틸리티
3. 데이터 가공과 처리
3.1. 왜 데이터 처리가 중요한가?
3.1.1. 신뢰성 확보를 위한 도구
3.1.2. 큰 데이터를 다루기 위한 도구
3.1.3. 이 정도면 훌륭한 분석 도구
3.1.4. 예제 데이터 소개
3.2. 데이터 입력과 출력
3.2.1. 파일 업로드
3.2.2. 데이터 확인하기
3.2.3. 데이터 내보내기
3.2.4. 파일 다운로드
3.3. 데이터 처리 기본
3.3.1. 질의
3.3.2. 질의 출력
3.3.3. 칼럼 선택
3.3.4. 칼럼 필터
3.3.5. 칼럼 요약
3.3.6. 칼럼 정렬
3.4. 데이터 구조 변환
3.4.1. 테이블 조인
3.4.2. 테이블 연결
3.4.3. 데이터 전치
4. 기술적 데이터 분석
4.1. 기술적 데이터 분석이란?
4.1.1. 데이터의 소리
4.1.2. 기술적 데이터 분석의 유형
4.1.3. 기술적 데이터 분석의 필요성
4.2. 수치형 데이터 분석
4.2.1. 수치형 데이터 분석이란?
4.2.2. 위치
4.2.3. 변동성
4.2.4. 모양
4.3. 범주형 데이터 분석
4.3.1. 범주형 데이터 분석이란?
4.3.2. 일원 빈도 분석
4.3.3. 결측률 분석
4.4. 데이터 변환
4.4.1. 데이터 순위화
4.4.2. 값 재코딩
4.4.3. 범위 재코딩
4.4.4. 데이터 변환
4.4.5. 데이터 표준화
5. 시각적 데이터 분석 I
5.1. 시각적 데이터 분석
5.1.1. 시각적 데이터 분석이란?
5.1.2. 공통 작업
5.2. 1차원 그래프
5.2.1. 막대 그래프
5.2.2. 원 그래프
5.2.3. 히스토그램
5.2.4. 상자 도표
5.3. 2차원 그래프
5.3.1. 산점도
5.3.2. 열지도
5.3.3. 시계열 도표
5.3.4. 모자이크 도표
5.4. 다차원 그래프
5.4.1. 선 그래프
5.4.2. 막대-선 그래프
5.4.3. 버블 도표
6. 시각적 데이터 분석 II
6.1. 지도 그래프란?
6.1.1. 지도 그래프란?
6.1.2. 위도와 경도
6.1.3. 지도 데이터
6.1.4. 지도의 유형
6.1.5. 지도 그래프의 종류
6.2. 위치 지도
6.2.1. 위경도 데이터 생성
6.2.2. 버블 지도
6.2.3. 산점 지도
6.2.4. 시계열 지도
6.3. 지역 지도
6.3.1. 등치 지역도
6.3.2. 텍스트 지도
맺음말
저자
■ 저자 소개
황보현우
하나금융지주 데이터본부장 겸 하나은행 데이터&제휴투자본부장으로서 하나금융그룹의 데이터 전략을 총괄하고 있다. 또한 하나벤처스 경영전략본부장/상무로서 하나금융그룹의 벤처캐피탈 설립을 담당하였으며, 코오롱베니트 빅데이터분석팀장으로서 다수의 빅데이터, 인공지능 프로젝트를 총괄하였다. 데이터 사이언스 분야의 세계적인 전문가로 불리는 저자는 홍콩과학기술대학교(HKUST) 겸임교수이며, 연세대학교 정보대학원 겸임교수, 단국대학교 데이터지식서비스공학과 겸임교수, 한남대학교 글로벌IT경영학과 교수로서 빅데이터와 인공지능을 강의하였다.
현재 국가데이터정책위원회 산업기반분과위원, 서울특별시 빅데이터심의위원회 위원장, 경기도 빅데이터위원회 부위원장으로 빅데이터 정책을 자문하고 있다. 주요 저서로는 『감으로만 일하던 김 팀장은 어떻게 데이터 좀 아는 팀장이 되었나(2021)』, 『파이썬 데이터 과학 통계 학습(2020)』 등이 있으며, 학술 논문으로 14편의 SCI(E)급 저널 논문과 12편의 KCI급 저널 논문을 게재한 바 있다.
한노아
세계 1위의 데이터 분석 SW 기업인 SAS Korea에서 PSD/Advanced Analytics 부문 컨설턴트로 재직 중이다. 연세대학교 정보통계학과를 졸업하였으며, SAS Korea 제13회 분석 챔피언십에서 공기질과 호흡기 질환의 연관 관계 규명으로 롯데멤버스 제3회 L. Point Big Data Competition에서 개인화 상품 추천으로 입상하였다. SAS Korea에서 NH농협은행, 광주은행, 삼성화재, KB손해보험, 한국타이어, LG유플러스, LF, 롯데마트 등 다수의 빅데이터 분석 프로젝트를 수행하였다.