본문 바로가기

분류 전체보기

(30)
[2024.05] AI 소식 1. Meta에서 대규모 멀티모달 모델 LMM(Large Multi-modal Model) 카멜레온(Chameleon)을 발표했습니다.처음부터 이미지, 텍스트 등을 단일 모델로 처리하는 초기 융합 토큰 기반 혼합 모달(early-fusion token-based mixed-modal)’을 사용하여 학습된 모델로서, 4.4T 크기의 토크나이저와 340B크기의 파라미터를 갖습니다.https://www.aitimes.com/news/articleView.html?idxno=159936 메타, 첨단 멀티모달 모델 ‘카멜레온’ 공개..."GPT-4o와 동일한 '초기 융합' 방식" - AI타임스메타가 택스트나 이미지 등 다른 양식을 처리하기 위해 복수의 모델을 하나로 결합하는 대신, 단일 모델에서 한꺼번에 처리하는..
[iGPT] Version 2.2.0 구현 내용Solar-mini-1-chat을 추가했다.GPT를 4o로 변경하였다.다른 챗봇들은 정리했다.
플러터(Flutter)에서 한글 입력시 마지막 글자 중복 입력 이벤트 발생 이런식으로 안녕하세요 입력 후 '요'만 추가적으로 입력되는 이벤트가 발생했다.원인은한글은 마지막까지 어떤 글자로 완성될지 모르는 특성 때문에 IME를 사용하는데다음과 같이 '요' 글자 밑에 밑줄이 있는 상태를 composing 상태라고하며 다음 입력받을 글자를 대기중인 상태이다.이때 엔터키 등으로 입력을 하게되면 TextEditingController 가 두번 실행게된다.해결법은if (textController.value.composing.isValid) { print('composing'); return; }다음과 같이 TextEditingController의 value에서 composing값을 isvalid로 검사하여 true일경우그러니까 밑줄이 있을 경우 return;으로 처리했다.완벽한..
[iGPT] Version 2.1.0 구현 내용PC에서 주로 사용하기 때문에 PC에서 UX를 위해 엔터키를 누르면 전송쉬프트 + 엔터키를 누르면 줄 바꿈을 구현했다.구현 내용textField의 TextInputType을 multiline으로 변경maxLines를 null로 변경textField를 KeyboadListner로 wrapping 후 shift키와 enter키가 같이 눌릴때와 enter키만 눌릴때를 구분 후 조건문 적용아쉬운 점textField의 multiline의 경우 enter키를 누르면 newline이 생기는데enter키로 전송을 구현했기 때문에 전송 후 textField에 newline이 생기는 이슈가 있다.아직까지는 flutter의 한계로 둘 중 하나만 사용하거나 이슈가 발생하거나 두가지 밖에 없다.
[2024.03.11~2024.03.17] AI 소식 1. Apple에서 새로운 MLLMs(Multi-modal Large Language Models) 'MM1'를 발표했습니다. 30B 크기의 MoE 구조 모델 입니다. https://arxiv.org/abs/2403.09611 MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training In this work, we discuss building performant Multimodal Large Language Models (MLLMs). In particular, we study the importance of various architecture components and data choices. Through careful and compr..
[iGPT] Version 2.0.0 구현 내용 1. GPT 4.0, DALL-E 3 추가 openAI에서 GPT 4를 업데이트하고 DALL-E도 3를 추가해줘서 오랜만에 추가해봤다. DALL-E 2에 비해서 훨씬 좋은 퀄리티를 보여준다.
[iGPT] Version 1.3.0 구현 내용 1. Code를 작성해주는 AI 추가 구현 방법 text-davinci-003을 사용하여 구현 코드 작성에 최적화된 code-davinci-002가 있었지만 지금은 사용을 못하고 text-davinci-003으로 통합되었다. gpt-3.5와 text-davinci의 차이는 다음과 같은데 간단히 말해서 gpt-3.5는 가격이 저렴하고 text-davinci는 더 비싼대신 정확하고 길게 나온다. gpt-3.5의 결과는 앞뒤로 설명이 있고 text-davinci는 결과만 리턴해준다. 추구하는 결과에 따라서 모델을 선택하면 된다. 추가로 gpt-3.5의 결과는 markdown의 codeblock으로 나오는데 이를 보기좋게 출력하고 싶어서 flutter_markdown 패키지를 사용해봤다. 조금 더 이..
[iGPT] Version 1.2.0 구현 내용 1. 이미지를 생성해주는 iDall-E 추가 2. 사용자의 입력 문장을 ChatGPT로 영어로 변경하여 Dall-E에게 전송 3. iGPT, iDall-E를 선택 가능한 메인 화면 추가 구현 방법 Dall-E가 한글은 정상적으로 생성하지 못하는 이슈가 있어서 사용자의 message를 gpt-3.5에게 번역을 맡겨서 영어로 번역 후 Dall-E에게 전달한다. Dall-E API의 return 값은 url로 받기 때문에 Image.network를 사용해서 표시해줬다. 번역된 문장도 따로 저장 후 이미지와 같이 보여주어 어떤 문장이 Dall-E에 전달되었는지 알려준다.
[iGPT] Version 1.1.1 구현 내용 1. 대화 내용을 드래그해서 복사를 가능하게 구현 구현 방법 채팅 내용을 보여주는 ListTile을 SelectionArea로 감싸서 구현
[iGPT] Version 1.1.0 구현 내용 1. 이전 대화 내용을 기억하고 답변 하도록 구현 2. 한국어로 대답하도록 설정 구현 방법 이전 대화를 반영하는 방법은 간단하다. 이전 대화도 같이 전달해주면 된다. messageList에는 유저의 대화와 ChatGPT의 답변이 순차적으로 들어가있다. 그래서 리스트에 대화 기록이 있으면 대화기록들을 messages 리스트에 user와 assistant로 교차해서 추가해주고 마지막에 유저가 입력한 내용까지 추가해줘서 api통신으로 전달할 data에 추가해준다.