본문 바로가기

Python11

[Openpyxl] Openpyxl을 이용한 엑셀 자동화 여러 자료들을 단순히 복사하여 붙여 넣는 방식으로 엑셀 보고서를 만드는 것은 시간이 많이 소요되는 단순 반복 작업이다. 이를 피하기 위해 엑셀 파일을 다루는데 최적화되어 있는 모듈인 openpyxl을 사용하여 서식이 있는 엑셀 보고서를 작성하는 방법을 학습하고자 한다. Openpyxl 기초 문법 : 엑셀의 파일, 시트, 셀을 객체화하여 파이썬에서 엑셀 파일을 효율적으로 다룰 수 있게 하는 모듈 시트 구조와 파일 불러오기 : 하나의 엑셀 파일은 하나의 workbook 과 하나의 sheet로 구성됨 : 엑셀 파일은 load_workbook 함수 사용하여 불러오기 가능하며 입력으로 filename(파일 이름)을 받음 : 수식을 보존한 채 가져오기 위해서는 data only 키워드에 false 입력! : 시트 .. 2022. 5. 15.
[Pandas] 데이터 기능 대체하기 엑셀을 가장 많이 사용하는 사람으로써, 엑셀은 정말 유용하고 편리한 툴이다. 그러나 유일한 단점은 느리다.. 그래서 대용량의 데이터를 다루기에는 부적합하고, 엑셀의 스크립트 언어인 VBA는 불필요할 정도로 복잡하다! 이를 위해서 우리 파이썬을 활용해 엑셀의 주요 기능을 효율적으로 대체하는 방법을 학습해보고자 한다. 데이터 기능 대체하기 엑셀에서 제공하는 정렬, 필터, 텍스트 나누기, 중복된 항목 제거 등의 데이터 기능 Sort_values 함수에 대한 이해 : 데이터 정렬은 하나 이상의 열을 기준으로 오름차순 혹은 내림차순으로 정렬하는 것 : by, ascending 인자가 있음! (by = 정렬 기준이 되는 열 이름 혹은 열 이름 목록을 설정하는 인자 [ex. df.sort_values(by=['A',.. 2022. 5. 14.
[Web Crawling] 웹 크롤링을 위한 파이썬의 Requests 모듈 Requests 모듈 기초 파이썬의 requests모듈은 웹 문서를 크롤링 하는데 필요한 모듈이다! 주요 함수인 get함수가 있다!! get 함수 기초 : 파이썬의 requests 모듈은 웹에 HTTP 요청을 보내는 역할을 함. : requests 모듈을 이용하여 HTTP 요청을 보내고 HTML 코드를 받는 함수는 get 함수! 이 함수는 url을 입력으로 받으면, 결과 값을 응답 객체에 담아 반환한다. : 응답 객체는 status_code, text, content라는 세가지 속성을 갖는다. - status_code = HTTP 요청이 정상적으로 이루어졌는지 알려주는 코드 (200) - text = HTML 코드를 텍스트로 반환함. - content = HTML 코드를 바이트로 변환함. [get 함수를.. 2022. 5. 8.
[Matplotlib] Matplotlib을 이용한 그래프 그리기-2 이번에는 Matplotlib의 고급 옵션과 함께 pandas의 자료형인 series 와 dataframe의 내장 함수를 사용하여 그래프를 손쉽게 그리는 방법을 학습! 고급 그래프 그리기 : Matplotlib은 단순한 그래프뿐만 아니라, 박스 플롯, 열지도, 누적 영역 그래프 등 고급 그래프를 손 쉽게 그릴 수 있는 함수를 제공함! boxplot 함수 : 박스 플롯은 변수의 범위와 중앙값 등을 빠르게 확인하는 목적으로 사용 - 최소값, 1사분위수, 2사분위수, 3사분위수, 최대값, 이상치 확인 가능 : boxplot() 함수 사용, X축에 들어갈 배열을 입력, 1차원 배열의 경우에는 하나의 박스를 2차원 배열의 경우에는 열의 개수만큼 박스 생성 from matplotlib import pyplot as .. 2022. 4. 2.