Kbank 블로그

Kbank 블로그

  • 분류 전체보기 (62)
    • People (5)
    • Team (7)
    • Culture (8)
    • Tech (29)
    • Internship (10)
    • Product · Service (3)
  • 홈
  • 공식 홈페이지
  • 인재영입
RSS 피드
로그인
로그아웃 글쓰기 관리

Kbank 블로그

컨텐츠 검색

태그

케이뱅크동호회 케이뱅크 직원 후기 Recommender System Ai QLoRA 케이뱅크 후기 케이뱅크 신규 입사자 케이뱅크 케이뱅크 채용 케이뱅크 경력직 llm 케이뱅크 신입 PEFT 케이뱅크 입사 LoRa 케이뱅크 입사 후기 케이뱅크문화 회사동호회 케이뱅크 온보딩 kbank

최근글

댓글

공지사항

아카이브

Tech(29)

  • 금융거래정보제공시스템(FID) DBMS 전환 과정기 (with. SingleStore DB)

    안녕하세요! 케이뱅크 경영테크팀 김우성 입니다. 이번 주제는 경영테크팀에서 운영 중인 '금융거래정보제공 시스템(FID)' 에 대한 소개와더 나은 시스템으로 발돋움하기 위해 MySQL에서 SingleStore 로의 전환과정을 공유하고자 합니다. 1. 금융거래정보제공?2. 금융거래정보제공시스템(FID)과 DBMS 전환배경3. SingleStore DBMS의 특징4. 결과 & ISSUE 사항5. 마무리하며 지금 시작합니다! 금융거래정보제공? 시스템 소개 전 업무에 대해 간단히 소개드리겠습니다. 금융거래정보제공은 '금융실명거래 및 비밀보장에 관한 법률 제4조'에 근거하여 정보제공요구자가 법률 요건에 맞게 요청을 하는 경우 사용목적에 맞게 금융정보를 제공하고 이에 대해 명의인에게 거래정보제공사실을 통보하는 금융회..

    2024.08.22
  • 거대 언어 모델 튜닝을 위한 미니멀리스트 접근법: 2부 - QLoRA로 학습하기

    들어가며 안녕하세요. 케이뱅크 데이터서비스팀에서 AI 업무를 하고 있는 김하영입니다.  이번 포스팅에서는 PEFT 방법 중 가장 핵심이 되는 QLoRA에 대해 실제코드를 살펴보고 학습 결과를 확인해 보겠습니다.   1부 되짚어 보기 지난 포스팅에서는 거대 언어 모델(LLM)을 조정하는 세 가지 방법에 대해 살펴보았습니다. In-context Learning은 프롬프트 입력 시 연관된 예시를 함께 제공하여 모델의 가중치를 업데이트하지 않고 프롬프트 엔지니어링만으로 문제를 해결하는 방법입니다. 사용자가 제공하는 예시의 수에 따라 Zero-shot 또는 Few-shot Learning 등으로 구분됩니다. 전체 파인튜닝(Full Fine-tuning)은 사전 학습된 모델(Pre-trained Model, PLM..

    2024.05.21
  • 거대 언어 모델 튜닝을 위한 미니멀리스트 접근법: 1부 - PEFT 알아보기

    들어가며 안녕하세요. 케이뱅크 데이터서비스팀에서 AI 업무를 하고 있는 김하영입니다.  이번 포스팅에서는 LLM(Large Language Model)이라 불리는 거대 언어 모델을 최소한의 비용과 인프라로 내 입맛에 맞게 조정하는 방법 중 하나인 PEFT(Parameter Efficient Fine-tuning)에 대해 다루어보려 합니다. 본 포스팅은 총 2부로 구성되어 있습니다. 1부에서는 LLM을 조정하는 여러가지 방법들을 소개합니다. 그리고 2부에서는 PEFT 방법 중에서도 가장 핵심이 되는 QLoRA에 대해 실제코드까지 자세히 살펴보겠습니다.    'Large' 언어 모델, 만능인가? 최근 메타에서 오픈소스 거대 언어 모델인 Llama 3를 공개했습니다. 8B 및 70B 라인업이며, 오는 7월에는..

    2024.04.29
  • 옵시디언(obsidian) : 나만의 두번째 뇌(Second Brain) 구축하기

    안녕하세요 케이뱅크 데이터서비스팀에서 AI/ML 업무를 하고 있는 임태훈입니다. 오늘은 지식을 저장하고 소비하는 방법론 대해서 얘기를 해보고자 합니다. 지식을 저장하고 소비하는 방법론에 이야기하면서 잘 정리된 메모는 나만을 위한 두 번째 뇌이며, 또 하나의 개인적인 AI라는 이야기를 해보고자 합니다. 현대사회에서는 트위터, 유튜브, 커뮤니티 등의 다양한 플랫폼등을 통해서 정말 많은 정보들이 쏟아져 나오고 있습니다. 제가 업무를 보고 있는 곳에서는 최근 LLM, 생성형 AI 분야에서 새로운 정보들이 엄청나게 많이 나오고 있습니다. 혹시 여러분들은 이러한 정보들을 어떻게 관리하고 계신가요? 정리가 되지 않은 정보들은 우리의 뇌 한구석이나 정보매체의 한 구석에서 쌓여만 가다가 그 의미가 퇴색되게 됩니다. 단순..

    2024.04.11
  • ChatGPT로 은행에서는 어떤 애플리케이션을 만들어 볼 수 있을까?

    안녕하세요. 케이뱅크 DataBiz팀에서 데이터 사이언티스트로 일하고 있는 조용걸입니다. 이 글에서는 ChatGPT와 Streamlit을 활용해 행내에서 진행했었던 PoC에 대해서 소개해 드리고자 합니다. ChatGPT 올 해에는 ChatGPT효과(?)로 관련 종사자뿐만 아니라 일반인들도 LLM, Foundation Model, ChatGPT의 문제점, 활용 사례 등을 뉴스나 다른 매체를 통해 심심치 않게 해당 내용을 접할 수 있었습니다. 그리고 업권과 분야를 가리지 않고 ChatGPT를 접목할 수 있는 방법과 사례에 대한 내용들이 테크 세미나에 단골 주제로 화두가 되었던 해였습니다. 이러한 분위기 덕택에 자연스레 행 내에서도 ChatGPT를 활용해 업무 생산성 또는 고객 경험을 향상할 수 있는 방안에 ..

    2023.12.25
  • 신분증 OCR 모델 학습을 위한 가상 데이터 생성하기

    들어가며안녕하세요! 케이뱅크 데이터서비스팀에서 AI 모델 개발을 하고 있는 김하영입니다.이번 포스팅에서는 신분증 OCR PoC를 진행하면서 겪었던 데이터 수집의 어려움을 공유하고, 이를 극복하기 위해 어떤 방법들을 적용했는지 간단하게 소개하고자 합니다.데이터 수집의 문제점우수한 성능의 신분증 OCR 모델을 개발하려면 대량의 신분증 데이터셋이 필수적입니다. 그러나 데이터를 수집하기에는 현실적으로 다양한 어려움이 있습니다. 개인 정보 포함여러분들도 아시다시피, 신분증에는 많은 개인 정보가 포함되어 있습니다. 먼저, 주민등록증에는 얼굴 사진, 이름, 주민등록번호, 주소 등 민감 정보가 존재합니다. 운전면허증에는 더불어 운전면허번호와 6자리 보안코드 등이 추가로 존재하지요. 이로 인해 대량의 원본 데이터를 획득..

    2023.12.15
이전
1 2 3 4 5
다음
공식 홈페이지 인재영입
© Kbank. All rights reserved.

티스토리툴바