본문 바로가기
👀 오늘 방문자:
📊 전체 방문자:
반응형

Stack of Learning15

커뮤니티 MVP에서 기능 고도화하기 완성하고 나니 뭔가 허전했다지난번에 1주일 만에 AI와 함께 강의 플랫폼 MVP를 완성했다고 썼는데, 막상 완성하고 나니까 뭔가 허전했다. 강의를 올리고, 수강하는 기본 기능은 다 있었지만 사용해보니까 그냥 혼자 보고 끝이었다."강의 듣다가 궁금한 게 생기면 어떻게 하지?" "강사한테 질문하고 싶은데 방법이 없네?" "다른 수강생들이랑 이야기해보고 싶은데..."이런 생각들이 계속 들더라. 그래서 이번엔 제대로 된 커뮤니티 기능을 만들어보기로 했다.기술 스택부터 다시 생각해보기처음엔 React로 프론트엔드를 만들었는데, 이번에 Next.js로 바꿨다. SEO도 신경 쓰고 싶었고, 라우팅도 좀 더 깔끔하게 하고 싶어서였다. 백엔드는 Django 그대로 유지했다.백엔드부터 차근차근사용자 인증 개선일반 로그인만.. 2025. 7. 24.
AI와 함께 커뮤니티 서비스 만들기(Gemini, Claude, Cursor) 시작은 단순한 아이디어였다요즘 ChatGPT, Claude 같은 AI가 핫하지만, 정작 직장인들은 "어떻게 써야 하지?"라는 생각만 든다고 한다. 그래서 '실무에서 바로 쓸 수 있는 AI 활용법'을 알려주는 온라인 강의 플랫폼을 만들어보기로 했다. 전문가와 사용자가 소통할 수 있는 커뮤니티 기능도 넣고 싶었다.근데 이번엔 혼자 코딩하지 않았다. Gemini, Claude, Cursor AI와 함께 마치 3명의 개발자가 협업하는 것처럼 프로젝트를 진행했다. 이걸 나는 '바이브 코딩' 이라고 부르기로 했다.(요즘 워낙 핫한 주제이기도 하다)팀원 소개: 나와 AI 3총사👨‍💻 나: 프로젝트 매니저, 최종 의사결정권자, 코드 검토 및 실행🤖 Gemini: 전체 컨셉 설계 + 백엔드 개발 담당🧠 Claud.. 2025. 7. 16.
중장년 맞춤 운동 RAG말고 파인튜닝?! - 데이터 전처리 과정 크롤링 이후의 현실3주간의 크롤링을 마치고 총 305개의 문서를 수집했다. 하지만 실제 데이터를 확인해보니 예상보다 품질이 고르지 못했다. 유튜브 자동 생성 자막에는 "음", "어" 같은 의미 없는 단어들이 많았고, 티스토리 포스트에는 광고 텍스트나 메뉴 항목들이 본문과 함께 추출되었다. 50플러스 포털에서도 헤더나 네비게이션 텍스트가 섞여 있었다. 그래서 바로 데이터를 사용할 수 는 없었고 먼저 RAG 시스템에 바로 활용하기에는 전처리가 필수적이었다.데이터 클리닝 단계1차 필터링: 길이 기준 제거첫 번째 기준은 단순했다. 텍스트 길이가 50자 미만인 문서는 의미 있는 정보를 담고 있지 않다고 판단하고 제거했다.제거된 예시:- "외국 by 외국당신..." (10자)- "자막 없음" (5자)- "고맙습니다.. 2025. 7. 8.
중장년 맞춤 운동 RAG 시스템 구축기 - 데이터 수집부터 벡터화까지 시작하게 된 계기어르신들에게 맞춤형 건강 정보를 제공하는 서비스를 만들어보고 싶었다. 기존 운동 정보들은 대부분 젊은 층 위주로 되어 있어서, 중장년층이 실제로 필요로 하는 정보와는 거리가 있었다. RAG(Retrieval-Augmented Generation) 시스템을 구축해서 이 문제를 해결해보기로 했다.우선 양질의 데이터가 필요했다. 3곳의 사이트를 타겟으로 정했다.티스토리 블로그: 전문가들이 작성한 건강 정보유튜브: 국민체력100 채널의 어르신 맞춤 운동 영상50플러스 포털: 서울시에서 운영하는 중장년 전용 사이트사이트별 크롤링 전략 수립1. 정적 vs 동적 사이트 구분하기처음에는 무작정 BeautifulSoup부터 시도해봤다. 하지만 사이트마다 접근 방식이 완전히 달랐다.티스토리는 전형적인 정적.. 2025. 7. 2.
반응형

loading