Data Science
Pandas파이썬에서 데이터 분석에 많이 이용함, 3가지 형태의 자료 구조와 연산 지원 연산- 데이터 선택- 데이터 가공- 데이터 분석- 데이터 편집데이터 선택원하는 영역의 원소를 선택하는 연산Column, Value 확인하기열(컬럼) 데이터 선택행(로우) 데이터 선택원하는 범위 데이터 선택조건 데이터 선택필터 데이터 선택 1. Column, Value 확인하기df = pd.DataFrame( np.random.rand(10, 4), index = pd.date_range('2000-12-31', periods=10, freq='D'), columns = ['A', 'B', 'C', 'D'])df 1-1. 전체 인덱스 확인하기df.index 1-2. 전체 컬럼 확인하기df.columns ..
Pandas파이썬에서 데이터 분석에 많이 이용함, 3가지 형태의 자료 구조와 연산 지원자료 구조- Series(1차원)- DataFrame(2차원)- Panel(3차원) -> 현재는 잘 사용되지 않음. DataFrame을 이용하여 다루는 것을 권장연산- 데이터 선택- 데이터 가공- 데이터 분석- 데이터 편집Pandas 라이브러리 Import# importimport numpy as npimport pandas as pd 1. Series1차원 자료구조리스트, 딕셔너리, 튜플, Scalar Value로부터 생성 가능numpy의 ndarray로부터 생성 가능pd.Series(data, index)d = {'a': 1, 'b' : 2, 'c': 3}ser = pd.Series(data=d, index=['a..
다변량 회귀 모델nbastat.csv(농구 점수 데이터셋)에서 야투 시도 횟수 (FGA), 3점슛 시도 횟수 (3PA), 자유투 시도 횟수 (FTA) 로부터 득점수 (PTS)를 예측하는 모델을 만들고 이를 훈련시키시오.가설y = 세타0 + 세타1(x1) + 세타2(x2) + 세타3(x3) 1. library importimport numpy as npimport pandas as pd 2. 드라이브 마운트 및 csv파일 업로드from google.colab import drivefrom google.colab import filesdrive.mount('/lecture-2023ai')files.upload()nbastat = pd.read_csv('nbastat2022.csv') 3. 행 수와 컬럼 ..
인공지능의 역사 1st Spring of AI (1950~1970)- 지식 표현, 추론(기존 지식-> 새로운 지식), 게임 트리(인공지능도 유희를 가질 수 있는가?)- 강한 인공지능을 추구 -> 기대만큼의 성과를 거두지 못하여 1st Winter 2nd Spring of AI (1980~1990)- 약한 인공지능을 추구- 추론 -> 전문가 시스템- 퍼셉트론 -> MLP, Backpropagation- 기대만큼의 성과를 거두지 못하여 2nd Winter 3rd Spring of AI (2010 ~)- 배경 : 충분한 데이터, 발전하는 컴퓨팅 파워, 새로운 기술(심층학습 등..)- 약한 인공지능을 추구 + 다양한 분야의 문제를 사람만큼 잘 해결하는 인공지능 - 시각 지능, 언어 지능, 데이터..
AI = Model + Data Model : y = Ax + B (선형 회귀 모델)- Model = Code(식) + Parameter(A, B)Data: [(x1, y1), (x2, y2), (x3, y3)...] 1. 수집된 데이터와 목적에 따라서 모델을 결정하고2. 데이터를 통해 학습시키며 최적의 모델의 파라미터를 구하는 것이 우리가 할 일3. AI와 데이터는 닭과 계란의 관계- AI -> 데이터 : 우수한 분석 도구- 데이터 -> AI : AI 모델 훈련에 필요 데이터의 종류 정형 데이터 : 속성을 명확하게 정의할 수 있는 데이터 - 데이터 하나는 다음과 같이 표현- i : 속성의 인덱스 (0 - j : 개체의 인덱스 (0 - 키, 몸무게, 나이를 가진 21명의 사람들 -> n = 3, m =..