본문 바로가기

전체 글

(26)
[2024.03.11~2024.03.17] AI 소식 1. Apple에서 새로운 MLLMs(Multi-modal Large Language Models) 'MM1'를 발표했습니다. 30B 크기의 MoE 구조 모델 입니다. https://arxiv.org/abs/2403.09611 MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training In this work, we discuss building performant Multimodal Large Language Models (MLLMs). In particular, we study the importance of various architecture components and data choices. Through careful and compr..
[iGPT] Version 2.0.0 구현 내용 1. GPT 4.0, DALL-E 3 추가 openAI에서 GPT 4를 업데이트하고 DALL-E도 3를 추가해줘서 오랜만에 추가해봤다. DALL-E 2에 비해서 훨씬 좋은 퀄리티를 보여준다.
[iGPT] Version 1.3.0 구현 내용 1. Code를 작성해주는 AI 추가 구현 방법 text-davinci-003을 사용하여 구현 코드 작성에 최적화된 code-davinci-002가 있었지만 지금은 사용을 못하고 text-davinci-003으로 통합되었다. gpt-3.5와 text-davinci의 차이는 다음과 같은데 간단히 말해서 gpt-3.5는 가격이 저렴하고 text-davinci는 더 비싼대신 정확하고 길게 나온다. gpt-3.5의 결과는 앞뒤로 설명이 있고 text-davinci는 결과만 리턴해준다. 추구하는 결과에 따라서 모델을 선택하면 된다. 추가로 gpt-3.5의 결과는 markdown의 codeblock으로 나오는데 이를 보기좋게 출력하고 싶어서 flutter_markdown 패키지를 사용해봤다. 조금 더 이..
[iGPT] Version 1.2.0 구현 내용 1. 이미지를 생성해주는 iDall-E 추가 2. 사용자의 입력 문장을 ChatGPT로 영어로 변경하여 Dall-E에게 전송 3. iGPT, iDall-E를 선택 가능한 메인 화면 추가 구현 방법 Dall-E가 한글은 정상적으로 생성하지 못하는 이슈가 있어서 사용자의 message를 gpt-3.5에게 번역을 맡겨서 영어로 번역 후 Dall-E에게 전달한다. Dall-E API의 return 값은 url로 받기 때문에 Image.network를 사용해서 표시해줬다. 번역된 문장도 따로 저장 후 이미지와 같이 보여주어 어떤 문장이 Dall-E에 전달되었는지 알려준다.
[iGPT] Version 1.1.1 구현 내용 1. 대화 내용을 드래그해서 복사를 가능하게 구현 구현 방법 채팅 내용을 보여주는 ListTile을 SelectionArea로 감싸서 구현