본문 바로가기

전체 글137

[머신러닝 응용]-1. 사전 준비 AI 경진대회 플랫폼 데이콘에서 제공하는 타이타닉 생존자 예측 데이터셋을 사용해보자! 1. 데이콘 데이터셋 다운로드 dacon.io/ 데이터사이언티스트 AI 컴피티션 3만 AI팀이 협업하는 인공지능 플랫폼 dacon.io 데이콘 사이트에 들어가 로그인을 한 뒤, '타이타닉'을 검색한다. '교육' 카테고리 -'[재난] 타이타닉: 누가 살아남았을까?'를 선택한다. 참여를 누르고, '데이터' 카테고리에서 다운로드를 클릭해주면, PC에 저장된다. 참여 시에 핸드폰 인증이 필요해서 쪼금 번거롭다. 다운로드 받은 파일을 압축해제 시켜주자! 2. 구글 드라이브에 파일 업로드 구글 드라이브에 [새로 만들기]에서 titanic이라는 이름으로 [새 폴더]를 만들어주었다. 만들어진 폴더에, 압축해제를 한 타이타닉 데이터셋을.. 2021. 3. 31.
[머신러닝 입문]-5 회귀(Regression)-보스턴 주택가격예측 회귀는 지도학습의 또다른 유형 중 하나이다. 보스턴 지역의 주택가격을 예측하는 모델을 만들어보자! 1. 데이터 로딩 보스턴 주색 데이터셋은 14개의 변수(열)로 구성된다. 각 열은 주택의 속성을 나타내는 피처를 말하고, 각 행은 개별 주택에 대한 데이터의 집합(레코드)를 나타낸다. 하나의 행이 하나의 샘플(주택)을 나타내고, 각 열에 맞춰 해당하는 데이터가 입력되어 있다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns #보스턴 주택 데이터셋 from sklearn import datasets housing = datasets.load_boston() #key 값 확인mport panda.. 2021. 3. 31.
[머신러닝 입문]-4. 분류(Classification)-붓꽃의 품종 판별 지도학습 유형 중 분류문제를 살펴보는 날이다! 붓꽃 데이터셋을 학습한 뒤 품종을 판별하는 모델을 만들어 볼 것이다. 분류 모델의 구조화, 모델 학습 및 성능 개선 프로세스를 학습하는 것을 목표로 삼는다. 1. 데이터 로딩 #라이브러리 환경: 판다스와 넘파이 사용 import pandas as pd import numpy as np #sklearn(사이킷런) 데이터셋에서 iris 데이터셋 로딩 from sklearn import datasets iris=datasets.load_iris() #딕셔너리 형태 #key값 확인 iris.keys() sklearn(사이킷런) 패키지는 붓꽃(iris) 데이터셋을 내장하고 있다. load_iris() 함수로 붓꽃 데이터를 불러오는데, iris 데이터셋은 딕셔너리 형태.. 2021. 3. 30.
[Toddler's Bottle] flag 문제풀이와 UPX 설치 오늘의 문제는 리버싱(reversing) 관련한 문제다. wget 명령을 이용해 우분투에 문제 파일을 다운로드 받아준다. 문제에서 리버싱에 대해서 언급했기에 디버거를 실행해 보았지만, 디버깅이 되지 않는다. 때문에 윈도우 환경에서 flag 파일의 구조에 대해서 파악하고자 한다! windows 환경에서 그냥 chrome에 url 치고 flag 파일을 다운로드 받았다. 헥스 에디터인 HxD에 flag 파일을 넣어봤더니 헤더 시그니터에 ELF가 보이고, 아래에 UPX도 눈에 띈다. ELF(Executable and Linkable Format})은 유닉스 계열의 실행파일임을 나타내며, UPX(Ultimate Packer for eXecutables)는 여러 운영 체제에서 수많은 파일 포맷을 지원하는 오픈 소스.. 2021. 3. 27.
[머신러닝 입문]-3. 일차함수 관계식 갖기 첫번째로 가장 기초적인 머신러닝 프로젝트를 생성해봤다. 1. 문제파악 (예제) y=x+1의 일차함수 관계의 식이 있다고 하자. 리스트 x,y는 각각 10개의 숫자를 원소로 갖는다. x=[-3, 31, -11, 4, 0, 22, -2, -5, -25, -14] y=[-2, 32, -10, 5, 1, 23, -1, -4, -24, -13] 2. 데이터 탐색 x,y 변수 사이의 관계식을 그래프로 그려볼건데, 이때 맷플롯립(matplolib) 패키지를 활용한다. import matplotlib.pyplot as plt x=[-3, 31, -11, 4, 0, 22, -2, -5, -25, -14] y=[-2, 32, -10, 5, 1, 23, -1, -4, -24, -13] plt.plot(x, y) plt.sh.. 2021. 3. 27.
[머신러닝 입문]-2. 머신러닝에 대하여 머신러닝(Machine Learning)은 레이블(Lable)이 있는 입력 데이터를 모델에 투입하면, 머신러닝 모델이 입력데이터와 정답 사이의 관계를 찾는다. 따라서 새로운 데이터를 입력했을 때 모델이 파악한 관계식을 적용하여 결과를 예측할 수 있다. 정답이 주어지지 않는 경우 데이터 속에 숨어 있는 패턴이나 규칙을 알아내는 것도 가능하다. 이처럼 사람이 어떤 규칙을 정하는 것이 아니라, 컴퓨터가 스스로 데이터를 학습하여 문제를 해결하는 과정을 말한다. 머신러닝은 정답을 알고 있는지에 대한 유무에 따라 지도학습(supervised learning)과 비지도학습(unsupervised learning)으로 나뉜다. 지도학습 지도학습은 입력데이터 X와 출력데이터 Y를 모두 알고 있는 상태에서, X와 Y의 관.. 2021. 3. 27.