Skip to content

✨ 생성형 AI와 Python을 활용한 웹 스크래핑: 실습하고 경험 나누기 ✨

Photo of Pyladies Seoul
Hosted By
Pyladies S.
✨ 생성형 AI와 Python을 활용한 웹 스크래핑: 실습하고 경험 나누기 ✨

Details

# ✨ 생성형 AI와 Python을 활용한 웹 스크래핑: 실습하고 경험 나누기 ✨

안녕하세요! 지난 번 조은님이 발표해주신 웹 스크래핑 세미나에서 뜨거운 관심을 받아, 직접 실습하고 경험을 나눌 수 있는 **"Python을 활용한 웹 스크래핑 워크숍"**을 마련했습니다. 이번 워크숍에서는 각자의 노트북을 준비해 직접 웹 스크래핑을 실습해보는 시간을 가질 예정입니다.
워크샵 개요

  • 일시: 2024년 8월 24일 토요일 오후 1시~6시
  • 장소: 서울특별시 강남구 테헤란로 211 한국고등교육재단 3층 (장소 후원 : 위시켓)
  • 준비물
  • 파이썬이 설치된 노트북(파이썬이 설치되지 않았다면 Google Colab 으로도 가능)
  • ChatGPT, Claude, Perplexity 등의 계정
  • 각자 수집하고 싶은 웹사이트 준비해 오기
  • 참가 인원: 30명 (선착순 마감)
  • 참가 대상: 여성 누구나
  • 참가비: 2만 5천원 (토스뱅크 1001-0090-0506 윤수진)
  • 참가비를 입금하기 어려운 상황이라면 따로 연락바랍니다. ([seoul@pyladies.com](http://mailto:seoul@pyladies.com/))

1. 시연 (1:00 PM - 2:00 PM)

  • 생성형 AI 및 RAG의 이해: 생성형 AI와 RAG의 기본 개념, 활용 사례
  • 도구 소개 및 시연: Python의 BeautifulSoup, Scrapy, Selenium과 생성형 AI, RAG 통합 도구 소개 및 시연
  • 예제: 텍스트 데이터의 요약, 중요 정보 추출, 텍스트 생성 등

2. 실습 1 (2:00 PM - 3:00 PM)

  • 웹사이트 데이터 수집 실습: 뉴스 사이트, 전자상거래 사이트 등에서 데이터 수집 실습
  • 예제: 특정 뉴스 기사의 제목, 날짜, 내용 수집 및 생성형 AI를 활용한 요약
  • 예제: 전자상거래 사이트에서 상품명, 가격, 평점 수집 및 sqlite DB 구축

3. 오류 공유 및 해결 (3:00 PM - 4:00 PM)

  • 오류 분석: 실습 중 발생한 오류를 각자 발표
  • 해결 방법 논의: 오류 해결을 위한 방법을 함께 논의하고 해결

4. 실습 2 (4:00 PM - 5:00 PM)

  • 개선된 실습: 오류 해결 후, 다시 도전하여 데이터 수집 및 생성형 AI를 활용한 데이터 처리 작업 수행
  • 추가 도전 과제: 텍스트 분석 및 OpenAI API 활용하기

5. 발표 및 피드백 (5:00 PM - 6:00 PM)

  • 데이터 발표: 각자 수집한 데이터와 생성형 AI를 활용한 처리 결과 발표
  • 피드백 제공: 발표된 데이터와 처리 결과 발표 및 네트워킹

실습 주제 아이디어

  • 뉴스 데이터 수집 및 요약: 특정 뉴스 사이트에서 최근 기사들의 제목, 날짜, 본문 수집 및 생성형 AI를 활용한 요약
  • 전자상거래 데이터 수집 및 분석: 상품명, 가격, 평점 등의 데이터를 수집하여 RAG를 활용한 가격 비교 분석 및 데이터베이스 구축
  • SNS 데이터 수집 및 분석: 특정 해시태그 또는 키워드를 기반으로 트위터 데이터 수집 및 생성형 AI를 활용한 감정 분석
  • 공공 데이터 수집 및 시각화: 정부 사이트에서 제공하는 공공 데이터 수집 및 생성형 AI를 활용한 데이터 시각화

참가 신청
웹 스크래핑에 관심이 많으신 분들, 실습을 통해 직접 경험을 쌓고 싶으신 분들 모두 환영합니다. 많은 참여와 관심 부탁드립니다!
궁금한 사항이 있으시면 언제든지 seoul@pyladies.com으로 문의해 주세요.
감사합니다.

✨ Web Scraping Workshop using Generative AI and Python: Practice and Share Experiences ✨
Hello! After the great interest shown in Joeun's web scraping seminar, we've organized a “Web Scraping Workshop using Python” where you can practice hands-on and share experiences. In this workshop, you'll have the opportunity to practice web scraping directly on your own laptop.

Workshop Overview

  • Date: Saturday, August 24, 2024, 1 PM - 6 PM
  • Location: Korea Foundation for Advanced Studies, 3rd Floor, 211 Teheran-ro, Gangnam-gu, Seoul (Venue sponsored by Wishket)
  • What to bring:
  • Laptop with Python installed (If Python isn't installed, Google Colab is also an option)
  • Account for ChatGPT, Claude, Perplexity, etc.
  • Prepare websites you'd like to collect data from
  • Participants: 30 people (First come, first served)
  • Who can join: Any woman
  • Participation fee: 25,000 KRW (Toss Bank 1001-0090-0506 Soojin Yoon)
  • You can make a bank transfer or bring cash on the day of the event. If the fee is a barrier for you, please don't hesitate to reach out to us at [seoul@pyladies.com](http://mailto:seoul@pyladies.com/). We're here to help!

Workshop Topics and Content
1. Demonstration (1:00 PM - 2:00 PM)

  • Understanding Generative AI and RAG: Basic concepts and use cases
  • Tool introduction and demo
  • Examples: Summarizing text data, extracting important information, generating text, etc.

2. Practice 1 (2:00 PM - 3:00 PM)

  • Website data collection practice: Collecting data from news sites, e-commerce sites, etc.

3. Error sharing and solving (3:00 PM - 4:00 PM)

  • Error analysis: Presenting errors encountered during practice
  • Discussing solutions: Discussing and solving errors together

4. Practice 2 (4:00 PM - 5:00 PM)

  • Improved practice: After solving errors, try again to collect data and process it using generative AI
  • Additional challenges: Text analysis and using OpenAI API

5. Presentation and feedback (5:00 PM - 6:00 PM)

  • Data presentation: Present collected data and results processed using generative AI
  • Providing feedback: Presenting processed data results and networking

Practice Topic Ideas

  • News data collection and summarization
  • E-commerce data collection and analysis
  • SNS data collection and analysis
  • Public data collection and visualization

How to Join
We welcome anyone interested in web scraping and those who want to gain hands-on experience through practice. We look forward to your participation and interest!
If you have any questions, please feel free to contact [seoul@pyladies.com](mailto:seoul@pyladies.com).
Thank you!

자세히 보기 Workshop content details

Photo of PyLadies Seoul Meetup group
PyLadies Seoul Meetup
See more events
한국고등교육재단
서울 강남구 테헤란로 211 · Seoul