본문 바로가기
반응형

hELLO wORLD! 156

[Python] Pandas 기초/ Series /DataFrame / 실습(1) Pandas 온전히 통계 분석을 위해 고안된 R 과는 다르게 python은 일반적인 프로그래밍 언어(general purpose programming language) 이며, 데이터 분석을 하기 위해서는 여러가지 라이브러리를 사용할 수 밖에 없다. 이 패키지들 중 R의 dataframe 데이터 타입을 참고하여 만든 것이 바로 pandas dataframe이다. pandas는 dataframe을 주로 다루기 위한 라이브러리이며, dataframe을 자유롭게 가공하는 것은 데이터 과학자들에게 중요하다.(출처) 모양은 엑셀 시트를 하나의 데이터 타입으로 만들어 놓은 듯 하다. 행과 열로 이루어져 있어, 테이블의 형식으로 볼 수 있다. DataFrame Series들의 집합. 여러개의 Series(행)이 모여 .. 2020. 10. 28.
[Python] pandas 기초(3) - 문제풀이 문제를 풀어보자. ▼답 더보기 import pandas as pd csv_test = pd.read_csv('dataset/Dataset.csv') csv_test.head() 간단하게 pd.read_csv로 읽어들인 뒤 head()를 써서 상위 5개만 뽑아보았다. ▼답 더보기 나눔고딕 폰트 설치 되어있어야 한다. import matplotlib as mpl import matplotlib.pyplot as plt #유니코드 깨지는 현상 방지 mpl.rcParams['axes.unicode_minus'] = False #폰트 설정 plt.rcParams['font.family'] = 'NanumBarunGothic' #테스트 plt.figure() plt.grid(True) plt.plot((1,1)) .. 2020. 10. 28.
[Python] Pandas 기초/ DataFrame / Series / 실습 Pandas 온전히 통계 분석을 위해 고안된 R 과는 다르게 python은 일반적인 프로그래밍 언어(general purpose programming language) 이며, 데이터 분석을 하기 위해서는 여러가지 라이브러리를 사용할 수 밖에 없다. 이 패키지들 중 R의 dataframe 데이터 타입을 참고하여 만든 것이 바로 pandas dataframe이다. pandas는 dataframe을 주로 다루기 위한 라이브러리이며, dataframe을 자유롭게 가공하는 것은 데이터 과학자들에게 중요하다.(출처) 모양은 엑셀 시트를 하나의 데이터 타입으로 만들어 놓은 듯 하다. 행과 열로 이루어져 있어, 테이블의 형식으로 볼 수 있다. DataFrame Series들의 집합. 여러개의 Series(행)이 모여 .. 2020. 10. 27.
[Spring] JSON / JSONP 개념 / spring MVC 복습(2) JSONP 보안상의 이슈를 우회하여 서로 다른 도메인이 데이터 공유가 가능하게 방법. (JSONP는 여러 보안상 이슈로 인하여 W3C에서는 2009년 채택된 CORS 방식의 HTTP 통신을 권장해서 이젠 거의 사용하지는 않는다.) 정확하게 이해하기 위해서는 차례대로 스토리가 필요하다. JSON(JavaScript Object Notation) 일반적으로 서버에서 클라이언트로 데이터를 보낼 때 사용하는 양식. 클라이언트가 사용하는 언어에 관계 없이 통일된 데이터를 주고받을 수 있도록, 일정한 패턴을 지닌 문자열을 생성해 내보내면 클라이언트는 그를 해석해 데이터를 자기만의 방식으로 온전히 저장, 표시할 수 있게 된다. 과거 웹 초기 시절부터 사용되어 온 XML은 헤더와 태그 등의 여러 요소로 가독성이 떨어지.. 2020. 10. 27.
[Spring] spring MVC / Oracle 연동 / Maven / spring 복습(1) 오늘의 목표! - spring MVC + Django => JSON P cross 데이터 시각화 - pandas 빅데이터 분석 - matplotlib 시각화 이번주는 데이터 수집 이후 분석에 관한 이야기를 할 것. 까먹었던 spring을 다시 복습할 기회! [ 새로운 환경 설정 ] 빅데이터를 위한 새로운 workspace 설정하기 [1] 서버 연결 1. sts3 실행 Tomcat 9.0을 바이너리로 다운로드할 것이다. 리눅스가 아닌 윈도우 환경이니까 64 bit-window zip으로! ▼바이너리 파일이 뭐야? 더보기 더보기 바이너리 파일이란? 사용자 또는 프로그램이 사용하던 정보나 숫자 값을 특별한 가공 없이 그대로 파일에 저장한 파일. 우리가 많이 사용하는 .jpg, png 같은 그림파일이나 음악파일.. 2020. 10. 26.
[빅데이터] 리눅스 / Selenium 설치 및 사용법 Selenium이란? WebBrowser(Chrome, Firefox, IE, Safari 등등)를 조작해주는 프레임워크(Framework). 일반적으로 웹 앱을 테스트할 때 주로 사용하는 프레임워크이다. webdriver(조작을 원하는 browser별로 실제 파일이 다름)라는 API를 이용해 브라우저를 제어할 수 있다. 브라우저를 직접 동작시킨다는 것은 JavaScript가 동작하면서 비동기적으로 서버로부터 콘텐츠를 가져오거나 숨겨져 있는 콘텐츠를 열거나 하는 등의 작업을 수행함을 의미한다. webdriver는 http프로토콜로 명령을 직접 날리고 확인 할 수 있다. Selenium 라이브러리에는 브라우저 조작이 가능한 다양한 기능이 존재하며, JS로 렌더링이 완료된 후의 DOM결과물에 접근이 가능하다.. 2020. 10. 23.
반응형
LIST