본문 바로가기

업무자동화4

Pandas로 데이터 정리 - 빠른 업무 자동화 Pandas로 데이터 정리하기 – 엑셀보다 빠른 파이썬 데이터 처리엑셀에서 하던 정렬·필터·집계를 Pandas로 더 빠르고 재현 가능하게 처리합니다.결측치/형 변환/그룹 집계까지 실무 흐름대로 예제를 제공합니다.왜 Pandas를 써야 할까요?반복 작업을 코드로 자동화 가능합니다.대용량 데이터 처리 속도 빠릅니다.버전관리·리뷰·재현성 확보 쉽습니다.설치 & 기본 세팅pip install pandas pyarrow # CSV/Parquet 다루기 권장import pandas as pdpd.__version__노트: pyarrow 설치하면 Parquet 입출력 속도와 호환성이 좋아집니다.샘플 데이터 가정CSV 예시(파일명: sales.csv) 가정하면:date,region,product,qty,price20.. 2025. 9. 9.
Python 웹 스크래핑 기초 – 초보자도 가능한 데이터 수집 자동화 Python 웹 스크래핑 기초 – 초보자도 가능한 데이터 수집 자동화웹 페이지에서 필요한 정보를 자동으로 가져오는 기술을 웹 스크래핑(Web Scraping)이라고 합니다. 뉴스 기사, 쇼핑몰 가격, 날씨 정보 등 반복적으로 확인하는 데이터를 자동으로 수집하면 시간을 크게 절약할 수 있습니다.1. 준비물pip install requests beautifulsoup4requests는 웹 페이지에 접속하는 라이브러리이고, BeautifulSoup은 HTML 문서를 분석하는 도구입니다.2. HTML 구조 이해하기웹 페이지는 기본적으로 HTML 태그로 구성됩니다. 예를 들어:오늘의 날씨28도이 구조에서 h1은 제목, p 태그는 온도 정보를 담고 있습니다.3. 기본 예제import requestsfrom bs4 .. 2025. 8. 19.
Python으로 PDF 데이터 추출하기 – 초보자도 가능한 업무 자동화 Python으로 PDF 데이터 추출하기 – 초보자도 가능한 업무 자동화보고서, 계약서, 청구서처럼 중요한 문서가 PDF로만 제공될 때, 데이터를 일일이 복사·붙여넣기 하는 대신 Python으로 자동 추출하면 업무 시간을 크게 줄일 수 있습니다.1. 필요한 라이브러리 설치PDF 처리에는 PyPDF2 또는 pdfplumber를 많이 사용합니다.pip install PyPDF2 pdfplumber2. 기본 – 텍스트 추출import PyPDF2with open("sample.pdf", "rb") as f: reader = PyPDF2.PdfReader(f) text = "" for page in reader.pages: text += page.extract_text() pri.. 2025. 8. 14.
Python으로 엑셀 업무 자동화하기 – 매크로 대신 파이썬 활용법(초보 가이드) Python으로 엑셀 업무 자동화하기 – 매크로 대신 파이썬 활용법(초보 가이드)엑셀 반복 작업 많음 → 파이썬으로 자동화 추천함. 설치부터 읽기/쓰기 기본, 폴더 일괄 처리, VBA와 비교까지 한 번에 정리함.왜 파이썬으로 하나?복잡한 전처리/후처리 가능함(Pandas, openpyxl 등 생태계 풍부함)여러 파일 일괄 처리 쉬움(폴더 루프만 돌리면 끝임)윈도우/맥/리눅스 어디서나 실행 가능함버전 관리·자동화 파이프라인과 궁합 좋음준비물(설치)Python 3.x 설치에디터: VS Code 추천(Python 확장 설치)필수 라이브러리 설치:pip install openpyxl pandas회사 PC 정책으로 pip 제한 있을 수 있음 → 가상환경(python -m venv .venv) 사용 권장함.기본: .. 2025. 8. 12.