✨ 생성형 AI와 Python을 활용한 웹 스크래핑: 실습하고 경험 나누기 ✨


Details
# ✨ 생성형 AI와 Python을 활용한 웹 스크래핑: 실습하고 경험 나누기 ✨
안녕하세요! 지난 번 조은님이 발표해주신 웹 스크래핑 세미나에서 뜨거운 관심을 받아, 직접 실습하고 경험을 나눌 수 있는 **"Python을 활용한 웹 스크래핑 워크숍"**을 마련했습니다. 이번 워크숍에서는 각자의 노트북을 준비해 직접 웹 스크래핑을 실습해보는 시간을 가질 예정입니다.
워크샵 개요
- 일시: 2024년 8월 24일 토요일 오후 1시~6시
- 장소: 서울특별시 강남구 테헤란로 211 한국고등교육재단 3층 (장소 후원 : 위시켓)
- 준비물
- 파이썬이 설치된 노트북(파이썬이 설치되지 않았다면 Google Colab 으로도 가능)
- ChatGPT, Claude, Perplexity 등의 계정
- 각자 수집하고 싶은 웹사이트 준비해 오기
- 참가 인원: 30명 (선착순 마감)
- 참가 대상: 여성 누구나
- 참가비: 2만 5천원 (토스뱅크 1001-0090-0506 윤수진)
- 참가비를 입금하기 어려운 상황이라면 따로 연락바랍니다. ([seoul@pyladies.com](http://mailto:seoul@pyladies.com/))
1. 시연 (1:00 PM - 2:00 PM)
- 생성형 AI 및 RAG의 이해: 생성형 AI와 RAG의 기본 개념, 활용 사례
- 도구 소개 및 시연: Python의 BeautifulSoup, Scrapy, Selenium과 생성형 AI, RAG 통합 도구 소개 및 시연
- 예제: 텍스트 데이터의 요약, 중요 정보 추출, 텍스트 생성 등
2. 실습 1 (2:00 PM - 3:00 PM)
- 웹사이트 데이터 수집 실습: 뉴스 사이트, 전자상거래 사이트 등에서 데이터 수집 실습
- 예제: 특정 뉴스 기사의 제목, 날짜, 내용 수집 및 생성형 AI를 활용한 요약
- 예제: 전자상거래 사이트에서 상품명, 가격, 평점 수집 및 sqlite DB 구축
3. 오류 공유 및 해결 (3:00 PM - 4:00 PM)
- 오류 분석: 실습 중 발생한 오류를 각자 발표
- 해결 방법 논의: 오류 해결을 위한 방법을 함께 논의하고 해결
4. 실습 2 (4:00 PM - 5:00 PM)
- 개선된 실습: 오류 해결 후, 다시 도전하여 데이터 수집 및 생성형 AI를 활용한 데이터 처리 작업 수행
- 추가 도전 과제: 텍스트 분석 및 OpenAI API 활용하기
5. 발표 및 피드백 (5:00 PM - 6:00 PM)
- 데이터 발표: 각자 수집한 데이터와 생성형 AI를 활용한 처리 결과 발표
- 피드백 제공: 발표된 데이터와 처리 결과 발표 및 네트워킹
실습 주제 아이디어
- 뉴스 데이터 수집 및 요약: 특정 뉴스 사이트에서 최근 기사들의 제목, 날짜, 본문 수집 및 생성형 AI를 활용한 요약
- 전자상거래 데이터 수집 및 분석: 상품명, 가격, 평점 등의 데이터를 수집하여 RAG를 활용한 가격 비교 분석 및 데이터베이스 구축
- SNS 데이터 수집 및 분석: 특정 해시태그 또는 키워드를 기반으로 트위터 데이터 수집 및 생성형 AI를 활용한 감정 분석
- 공공 데이터 수집 및 시각화: 정부 사이트에서 제공하는 공공 데이터 수집 및 생성형 AI를 활용한 데이터 시각화
참가 신청
웹 스크래핑에 관심이 많으신 분들, 실습을 통해 직접 경험을 쌓고 싶으신 분들 모두 환영합니다. 많은 참여와 관심 부탁드립니다!
궁금한 사항이 있으시면 언제든지 seoul@pyladies.com으로 문의해 주세요.
감사합니다.
✨ Web Scraping Workshop using Generative AI and Python: Practice and Share Experiences ✨
Hello! After the great interest shown in Joeun's web scraping seminar, we've organized a “Web Scraping Workshop using Python” where you can practice hands-on and share experiences. In this workshop, you'll have the opportunity to practice web scraping directly on your own laptop.
Workshop Overview
- Date: Saturday, August 24, 2024, 1 PM - 6 PM
- Location: Korea Foundation for Advanced Studies, 3rd Floor, 211 Teheran-ro, Gangnam-gu, Seoul (Venue sponsored by Wishket)
- What to bring:
- Laptop with Python installed (If Python isn't installed, Google Colab is also an option)
- Account for ChatGPT, Claude, Perplexity, etc.
- Prepare websites you'd like to collect data from
- Participants: 30 people (First come, first served)
- Who can join: Any woman
- Participation fee: 25,000 KRW (Toss Bank 1001-0090-0506 Soojin Yoon)
- You can make a bank transfer or bring cash on the day of the event. If the fee is a barrier for you, please don't hesitate to reach out to us at [seoul@pyladies.com](http://mailto:seoul@pyladies.com/). We're here to help!
Workshop Topics and Content
1. Demonstration (1:00 PM - 2:00 PM)
- Understanding Generative AI and RAG: Basic concepts and use cases
- Tool introduction and demo
- Examples: Summarizing text data, extracting important information, generating text, etc.
2. Practice 1 (2:00 PM - 3:00 PM)
- Website data collection practice: Collecting data from news sites, e-commerce sites, etc.
3. Error sharing and solving (3:00 PM - 4:00 PM)
- Error analysis: Presenting errors encountered during practice
- Discussing solutions: Discussing and solving errors together
4. Practice 2 (4:00 PM - 5:00 PM)
- Improved practice: After solving errors, try again to collect data and process it using generative AI
- Additional challenges: Text analysis and using OpenAI API
5. Presentation and feedback (5:00 PM - 6:00 PM)
- Data presentation: Present collected data and results processed using generative AI
- Providing feedback: Presenting processed data results and networking
Practice Topic Ideas
- News data collection and summarization
- E-commerce data collection and analysis
- SNS data collection and analysis
- Public data collection and visualization
How to Join
We welcome anyone interested in web scraping and those who want to gain hands-on experience through practice. We look forward to your participation and interest!
If you have any questions, please feel free to contact [seoul@pyladies.com](mailto:seoul@pyladies.com).
Thank you!

✨ 생성형 AI와 Python을 활용한 웹 스크래핑: 실습하고 경험 나누기 ✨