버클리 대학 연구팀이 딥씩(DeepSeek)의 기초 버전(DeepSeek R1-Zero)을 30달러에 재현했다고 해서 시끌시끌합니다. 간단히 DeepSeek R1-Zero 알고리즘을 사용해서 문제 해결 목적 및 방법 등을 제시하고, AI에게 푸는 방법을 찾으라고 했는 데 성공했다고.
이들이 해결하려고 했던 문제는 영국 게임쇼 카운트 다운-에서 제시하는 수학 문제인데요. 아래 그림처럼 무작위로 숫자 여섯 개를 선택한 다음, 그걸 더하고 빼고 곱하고 나누고 해서, 목표 숫자가 되게 만드는 퀴즈 게임입니다.
어려움은 없었을까요? 그냥 작동했다-라고 하네요. 기본 모델은 알리바바에서 제공하는 Qwen-2.5-Base 모델을 이용했는데, 이 모델에서 쓰는 매개 변수(AI 크기라고 퉁치죠)에 따라 성능은 달랐지만(5억 매개 변수 모델은 잘 작동 안 함), 15억 매개 변수부터는 알아서 해결책을 잘 찾았다고.
... 여기에 들어간 비용이 대충 30달러. 하하하.
이걸 어디에 써... 하는 생각이 들었지만, 소프트웨어적으로 해결책을 찾는 일에는 쓸 일이 좀 있겠다는 생각이 들었네요. 예를 들어 일본 이온 몰에서, 마감 전 할인 세일 가격을 AI에 맡기는 곳이 있거든요?
세일 가격은 이제까지 고참 직원들이 감으로 결정했던 건데, AI에 맡겼다고 합니다. 목표는 판매량 증대 및 폐기 상품을 줄이는 거였는데, 뜻밖의 효과로 직원들의 심적 부담이 줄었다고.
기본 데이터가 준비되어야 하지만, 이런 다양한 문제에 이미 공개된 AI를 이용해 해결책을 찾는 작업은 널리 퍼질 수 있을 거라 생각합니다. 요즘 가격표는 전자잉크로 표시하는 곳이 늘어서, 바로 할인가를 표기할 수도 있고요.
... 그리고 이걸 AI 방송 시스템에 연결해 자동으로 '지금부터 정육 매장에선 쇠고기를 최대 30% 할인가에 판매하겠습니다' 같은 방송을 내보낼 수 있다면... 흠흠흠.
아무튼 제가 보는 AI는 제품보다는 기능입니다. 프로그램 코딩할 때 기초 작업을 해주는 것처럼, 그 자체로 뭔가를 다 해내기보다는, 업무 프로세스에 (소프트웨어적으로) 통합될 때 빛나더라고요.
그리고 딥씩 쇼크는, 이렇게 AI를 기능적으로 통합할 때 도움을 줄 수 있을 거라고 생각합니다.
+ 문제는 기본 데이터를 준비하는 게 생각보다 쉽지 않다는 거...
+ 카운트 다운 게임을 카운터 스트라이크 게임으로 연상하고 여기서 무슨 문제를 풀어? 생각했다는 함정이... 크라우드 스트라이크 사태 때도 이 게임 이름으로 잘못 말해서 고생했는데요.
+ 해당 내용을 보고한 글.
https://nitter.lucabased.xyz/jiayi_pirate/status/1882839370505621655
+ 관련 소스
https://github.com/Jiayi-Pan/TinyZero