본문 바로가기

인공지능

(13)
[2024.05] AI 소식 1. Meta에서 대규모 멀티모달 모델 LMM(Large Multi-modal Model) 카멜레온(Chameleon)을 발표했습니다.처음부터 이미지, 텍스트 등을 단일 모델로 처리하는 초기 융합 토큰 기반 혼합 모달(early-fusion token-based mixed-modal)’을 사용하여 학습된 모델로서, 4.4T 크기의 토크나이저와 340B크기의 파라미터를 갖습니다.https://www.aitimes.com/news/articleView.html?idxno=159936 메타, 첨단 멀티모달 모델 ‘카멜레온’ 공개..."GPT-4o와 동일한 '초기 융합' 방식" - AI타임스메타가 택스트나 이미지 등 다른 양식을 처리하기 위해 복수의 모델을 하나로 결합하는 대신, 단일 모델에서 한꺼번에 처리하는..
[2024.03.11~2024.03.17] AI 소식 1. Apple에서 새로운 MLLMs(Multi-modal Large Language Models) 'MM1'를 발표했습니다. 30B 크기의 MoE 구조 모델 입니다. https://arxiv.org/abs/2403.09611 MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training In this work, we discuss building performant Multimodal Large Language Models (MLLMs). In particular, we study the importance of various architecture components and data choices. Through careful and compr..
바이오스 업데이트 후 게임 등 버벅임 문제 해결법 (라이저 케이블 유저) 결론: 라이저 케이블을 PCI 3.0 제품을 사용중이면 메인보드 설정에서 PCI 슬롯 버전을 Gen 3로 설정하기 오랜만에 바이오스를 업데이트 후 그래픽카드가 제대로 로드되지 않고 사용률이 낮게 유지되어 버벅임이 발생하는 현상이 생겼다. 그래서 해결하기 위해서 1. 이전 바이오스 버전으로 돌아가기 2. 최신 윈도우 업데이트 제거 3. 그래픽카드 드라이버 버전 낮추기 하지만 모두 해봐도 해결되지 않았는데 갑자기 든 생각이 예전 조립할 때 라이저 케이블을 사용해서 그래픽카드를 장착했던 것이었다. 그당시 메인보드와 그래픽카드 모두 PCI 4.0을 지원했는데 라이저 케이블은 PCI 4.0을 지원하는 제품이 없어서 어쩔 수 없이 PCI 3.0 제품으로 장착했었고 바이오스에서 PCI 1번 슬롯을 Gen 3로 설정해..
사람같은 인공지능은 좋은 것인가? 최근 머릿속에서 혼자 고민하는 주제입니다. 사람들은 사람 같은 인공지능을 만들기를 원합니다. 만약 정말 사람 같은 인공지능을 만들었다고 가정해 봅시다. 각각의 방에 있는 사람과 인공지능에게 10892 x 761의 답이 뭐냐고 물어본다면 만약 사람이라면 모른다고 하거나 계산이 오래 걸릴 겁니다. 그리고 사람 같은 인공지능이라면 마찬가지의 반응을 보이고 튜링 테스트를 통과하겠죠. 그렇다면 이렇게 통과한 인공지능은 좋은 것일까요? 사람이 인공지능을 만드는 건 도움을 받기 위해서 일 겁니다. 어려운 연산을 도움받기 위해 물어봤는데 모른다고 대답하는 인공지능은 과연 좋은 인공지능일까요? 그렇다고 곧바로 계산 결과를 말하는 인공지능을 사람 같은 인공지능이라 할 수 있을까요? 그럼 사람 같지 않은 인공지능이 좋은 인..
CIFAR 100 데이터셋 이미지로 저장하는 방법 기본 적인 방법은 CIFAR 10과 동일하나 몇 가지 다른 점이 있습니다. https://mindw96.tistory.com/9 CIFAR 10 데이터셋 이미지로 저장하는 방법 Tensor Flow나 PyTorch을 사용한 데이터셋 형태가 아니라 각각의 개별 이미지가 필요해서 작성한 코드를 공유 합니다. 순서는 1. https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz 이곳에서 파일을 받고.. mindw96.tistory.com https://www.cs.toronto.edu/~kriz/cifar-100-python.tar.gz 에서 파일 저장 후 원하는 곳에 압축 해제 압축 해제 한 곳에서 첨부한 py 파일을 실행 혹은 아래의 코드를 실행 (numpy 설치..
CIFAR 10 데이터셋 이미지로 저장하는 방법 Tensor Flow나 PyTorch을 사용한 데이터셋 형태가 아니라 각각의 개별 이미지가 필요해서 작성한 코드를 공유 합니다. 순서는 1. https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz 이곳에서 파일을 받고 원하는 폴더에 압축 해제 2. 압축 해제 한 곳에서 첨부한 py 파일을 실행 혹은 아래의 코드를 실행 (numpy 설치는 필수 입니다.) import numpy as np from PIL import Image import os import pickle def unpickle(file): with open(file, 'rb') as fo: dict = pickle.load(fo, encoding='bytes') return dict with op..
OpenCV로 실시간 웹캠 이미치 처리시 문제점 논문 제출 시 추가적인 자료로 데모 영상을 제출하기 위해서 웹캠을 통해서 실시간으로 이미지 처리를 하려고 OpenCV를 활용해봤다. 문제는 어떤 걸 찍든지 하나의 클래스로만 분류를 하는 점이었다. 처음에는 오버피팅을 의심했으나 웹캠에 찍힌 이미지로 테스트를 해보면 잘 됐다. 그래서 원인을 분석해본 결과 OpenCV의 버그였다. 기존 While문 안에서 Frame별 이미지를 Tensor로 전환하여 모델에 전달했던 방법에서 Frame별 이미지를 우선 cv2.imwrite로 저장하고 그걸 PIL로 불러와서 Tensor로 전환하여 모델에 전달했더니 잘 작동했다. 정확한 원인은 모르지만 cv2.videocapture의 Frame 값이 정상적인 값은 아닌것같다. 현재 버전(4.5.4.58)만의 문제인지는 모르겠으나..
Jupyter Notebook 전용 Data Spell 출시 https://www.jetbrains.com/ko-kr/dataspell/ JetBrains DataSpell: 데이터 과학용 IDE www.jetbrains.com Pychram, Intelli J로 유명한 Jetbrains에서 Jupyter Notebook 전용 IDE인 DataSpell을 새롭게 출시했습니다. 아직은 테스트 버전으로 정식 출시가 아니기 때문에 버그가 많지만 IDE가 나올 만큼 Jupyter Notebook을 사용하는 유저들이 많아졌고 그만큼 인공지능과 데이터 사이언스에 대한 관심과 사용이 많아졌다는 거겠죠 상세 기능을 보면 데이터 사이언스에 더 초점을 맞춘 IDE 같습니다. ipynb, R, SQL을 다루어야 하는 작업 시에 매우 유용해 보입니다. 다음은 제가 직접 설치해보고 사용..
NotJSONError('Notebook does not appear to be JSON: \'{\\n "cells": [\\n {\\n "cell_type": "c...') 해결 방법 Ipynb로 모델을 학습시키고 퇴근했는데 출근하니 컴퓨터가 재부팅되어 있었다. 그래서 살펴보려고 ipynb 파일을 다시 실행하려고하니 pychram, vscode, jupyter notebook 모두 실행이 안됐다. 찾아보니 원인은 특정 cell의 output 값이 너무 많아서 cache가 너무 크거나 하는 등의 이유로 컴퓨터가 재부팅됐고 그 과정에서 ipynb 파일 자체가 손상이 되어서 정상적으로 실행이 안되는 문제이다. 해결법으로는 1. 새로운 ipynb 파일을 만든다. 2. 실행이 안되는 ipynb 파일과 새로 만든 ipynb 파일을 메모장으로 실행한다. 3. 메모장으로 연 새로 만든 ipynb 파일의 내용 가장 아래에 있는 "outputs" 부분부터 끝까지를 복사 한 후 열리지않는 ipynb 파일..
A SURVEY OF EMBODIED AI: FROM SIMULATORS TO RESEARCH TASKS 논문 정리 - 1 https://arxiv.org/abs/2103.04918 Embodied AI 분야의 Survey 논문입니다. 시뮬레이터에 대한 설명과 여러 가지 평가 방법들, Embodied AI의 연구 주제 등을 쉽게 잘 설명해주는 논문이어서 입문으로 읽기에 적합합니다. ABSTRACT 최근 인공지능의 패러다임은 인터넷상에 널리 퍼져있는 이미지, 비디오, 텍스트 등을 활용하여 학습하는 "Internet AI"에서 실제 혹은 시뮬레이션에서 학습을 하는 "Embodied AI"로 변화하고 있습니다. Embodied AI에 대한 관심은 증가하고 있지만 이에 대한 포괄적인 조사(Survey)는 이루어지지 않고 있습니다. 본 논문에서는 SOTA 수준의 시뮬레이터 9개를 벤치마킹하여 시뮬레이터가 Embodied AI 연구에 ..