0
gpt-4o mini 발표

 

chatgpt-4o mini가 나왔습니다.

이름에서 알 수 있듯 경량화 모델로보이느데, 으잉? 성능이 3.5터보보다 좋고 싼듯하네요?!?!

 

아래는 openai 사이트를 딥엘로 번역한 글입니다. 

 

OpenAI는 인텔리전스를 최대한 폭넓게 이용할 수 있도록 최선을 다하고 있습니다. 오늘 저희는 가장 비용 효율적인 소형 모델인 GPT-4o mini를 발표합니다. GPT-4o mini는 인텔리전스를 훨씬 더 저렴하게 제공함으로써 AI로 구축된 애플리케이션의 범위를 크게 확장할 것으로 기대합니다. GPT-4o mini는 MMLU에서 82%의 점수를 받았으며 현재 LMSYS 리더보드(새 창에서 열기)에서 채팅 환경 설정에서 GPT-41을 능가하는 성능을 보이고 있습니다. 가격은 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트로, 이전 프론티어 모델보다 훨씬 저렴하고 GPT-3.5 터보보다 60% 이상 저렴합니다.

GPT-4o mini는 저렴한 비용과 지연 시간으로 여러 모델 호출을 연결하거나 병렬화하는 애플리케이션(예: 여러 API 호출), 모델에 대량의 컨텍스트(예: 전체 코드 베이스 또는 대화 기록)를 전달하거나 빠른 실시간 문자 응답을 통해 고객과 상호작용하는 애플리케이션(예: 고객 지원 챗봇) 등 광범위한 작업을 수행할 수 있도록 지원합니다.

현재 GPT-4o mini는 API에서 텍스트와 비전을 지원하며, 향후 텍스트, 이미지, 비디오 및 오디오 입출력을 지원할 예정입니다. 이 모델은 128K 토큰의 컨텍스트 창을 가지고 있으며 요청당 최대 16K 출력 토큰을 지원하며 2023년 10월까지 지식을 보유합니다. GPT-4o와 공유되는 개선된 토큰화기 덕분에 이제 영어 이외의 텍스트를 처리하는 것이 훨씬 더 비용 효율적입니다.

뛰어난 텍스트 지능과 복합 추론 능력을 갖춘 소형 모델

GPT-4o mini는 텍스트 지능과 다중 모드 추론 모두에서 학술 벤치마크에서 GPT-3.5 Turbo 및 기타 소형 모델을 능가하며, GPT-4o와 동일한 범위의 언어를 지원합니다. 또한 개발자가 데이터를 가져오거나 외부 시스템으로 작업을 수행하는 애플리케이션을 구축할 수 있는 함수 호출에서 강력한 성능을 발휘하며, GPT-3.5 터보에 비해 향상된 장문맥 성능을 보여줍니다.

GPT-4o mini는 여러 주요 벤치마크2에서 평가되었습니다.

추론 작업: 텍스트 지능 및 추론 벤치마크인 MMLU에서 82.0%의 점수를 받은 GPT-4o mini는 텍스트와 시각을 모두 포함하는 추론 작업에서 다른 소형 모델보다 우수하며, Gemini Flash의 77.9%, Claude Haiku의 73.8%에 비해 월등히 높습니다.

수학 및 코딩 능력: GPT-4o mini는 수학적 추론과 코딩 작업에서 탁월한 성능을 발휘하여 시중의 기존 소형 모델보다 뛰어난 성능을 보였습니다. 수학적 추론을 측정하는 MGSM에서 GPT-4o mini는 87.0%를 기록하여 Gemini Flash의 75.5%, Claude Haiku의 71.7%에 비해 월등히 높은 점수를 받았습니다. 코딩 성능을 측정하는 HumanEval에서는 GPT-4o mini가 87.2%를 기록해 Gemini Flash의 71.5%, Claude Haiku의 75.9%에 비해 높은 점수를 받았습니다.  

멀티모달 추론: GPT-4o mini는 멀티모달 추론 평가인 MMMU에서도 59.4%를 기록해 Gemini Flash의 56.1%, Claude Haiku의 50.2%에 비해 높은 성능을 보였습니다.

 

모델 개발 과정의 일환으로 신뢰할 수 있는 소수의 파트너와 협력하여 GPT-4o mini의 사용 사례와 한계를 더 잘 이해했습니다. 영수증 파일에서 구조화된 데이터를 추출하거나 스레드 기록이 제공될 때 고품질 이메일 응답을 생성하는 등의 작업에서 GPT-4o mini가 GPT-3.5 터보보다 훨씬 우수한 성능을 보인다는 사실을 확인한 Ramp(새 창에서 열기) 및 Superhuman(새 창에서 열기)과 같은 회사와 협력했습니다.

내장된 안전 조치

안전은 처음부터 모델에 내장되어 있으며 개발 프로세스의 모든 단계에서 강화됩니다. 사전 학습에서는 혐오 발언, 성인 콘텐츠, 주로 개인정보를 수집하는 사이트, 스팸 등 모델이 학습하거나 출력하지 않기를 바라는 정보를 필터링(새 창에서 열기)합니다. 사후 학습에서는 모델 응답의 정확성과 신뢰성을 향상시키기 위해 강화 학습과 인간 피드백(RLHF) 등의 기술을 사용하여 모델의 행동을 정책에 맞게 조정합니다.

GPT-4o mini에는 준비 프레임워크에 따라 자발적 약속에 따라 자동화된 평가와 인적 평가를 모두 사용하여 신중하게 평가한 GPT-4o와 동일한 안전 완화 기능이 내장되어 있습니다. 사회심리학 및 잘못된 정보 등의 분야에서 70명 이상의 외부 전문가가 GPT-4o를 테스트하여 잠재적인 위험을 식별했으며, 이에 대한 자세한 내용은 곧 발표될 GPT-4o 시스템 카드 및 준비도 스코어카드에서 공유할 계획입니다. I

 

사용 가능 여부 및 가격

이제 어시스턴트 API, 채팅 완료 API, 배치 API에서 텍스트 및 비전 모델로 GPT-4o mini를 사용할 수 있습니다. 개발자는 1M 입력 토큰당 15센트, 1M 출력 토큰당 60센트(표준 책의 약 2500페이지에 해당)를 지불합니다. 앞으로 며칠 내에 GPT-4o 미니에 대한 미세 조정을 진행할 계획입니다.

ChatGPT에서 무료, 플러스, 팀 사용자는 오늘부터 GPT-3.5 대신 GPT-4o mini에 액세스할 수 있습니다. 모든 사람이 AI의 혜택을 누릴 수 있도록 한다는 사명에 따라 다음 주부터 기업 사용자도 이용할 수 있게 될 것입니다.

다음 단계

지난 몇 년 동안 저희는 비용의 대폭적인 절감과 함께 AI 인텔리전스의 괄목할 만한 발전을 목격했습니다. 예를 들어, 2022년에 도입된 성능이 낮은 모델인 텍스트 다빈치-003 이후 GPT-4o 미니의 토큰당 비용은 99% 하락했습니다. 저희는 모델 기능을 향상시키면서 비용을 절감하는 이러한 추세를 이어가기 위해 최선을 다하고 있습니다.

모든 앱과 웹사이트에 모델이 원활하게 통합되는 미래를 상상하고 있습니다. GPT-4o mini는 개발자가 강력한 AI 애플리케이션을 보다 효율적이고 경제적으로 구축하고 확장할 수 있는 길을 열어주고 있습니다. AI의 미래는 더욱 접근하기 쉽고, 안정적이며, 일상적인 디지털 경험에 내장되고 있으며, 유니티는 계속해서 그 길을 선도할 수 있게 되어 기쁘게 생각합니다.

 

티쳐✨ 전라남도
소개
::: Foreducator.com을 운영하는 수학교사 ::: '수학하는 즐거움 시리즈', '수업의 과정' 저자
로그인 후 댓글을 작성하실 수 있습니다.
Pic
ChatGPT 07월 22일 대댓글

와, GPT-4o mini의 성능과 가격이 정말 인상적이네요! AI 기술이 더욱 발전하고 접근하기 쉬워지면서 다양한 분야에서 혁신적인 응용이 가능해지겠죠. 앞으로 더 많은 기대가 되는 발전이 있을 것 같습니다.


Activity Logs

There are 2 new tasks for you in “AirPlus Mobile App” project:
Added at 4:23 PM by
img
Meeting with customer
Application Design
img
img
A
In Progress
View
Project Delivery Preparation
CRM System Development
img
B
Completed
View
Invitation for crafting engaging designs that speak human workshop
Sent at 4:23 PM by
img
Task #45890merged with #45890in “Ads Pro Admin Dashboard project:
Initiated at 4:23 PM by
img
3 new application design concepts added:
Created at 4:23 PM by
img
New case #67890is assigned to you in Multi-platform Database Design project
Added at 4:23 PM by
Alice Tan
You have received a new order:
Placed at 5:05 AM by
img

Database Backup Process Completed!

Login into Admin Dashboard to make sure the data integrity is OK
Proceed
New order #67890is placed for Workshow Planning & Budget Estimation
Placed at 4:23 PM by
Jimmy Bold

Shopping Cart

Iblender The best kitchen gadget in 2022
$ 350 for 5
SmartCleaner Smart tool for cooking
$ 650 for 4
CameraMaxr Professional camera for edge
$ 150 for 3
$D Printer Manfactoring unique objekts
$ 1450 for 7
MotionWire Perfect animation tool
$ 650 for 7
Samsung Profile info,Timeline etc
$ 720 for 6
$D Printer Manfactoring unique objekts
$ 430 for 8