news,

Welcome to the Gemini Era

Soohwan Kim
Co-founder/A.I. engineer at TUNiB.
More posts by Soohwan Kim.

Soohwan Kim

07 Dec 2023•3 min read

Welcome to the Gemini Era

Google이 드디어 OpenAI에 대한 반격을 시작한걸까요?

구글이 ‘Gemini’라는 이름의 초거대 모델을 갑작스럽게 공개했습니다. MMLU 벤치마크에서 GPT-4를 넘으며, 32개 중 30개에서 SOTA를 달성했다고 하네요.

그리고 멀티모달 모델이여서 텍스트뿐만 아니라 음성, 이미지, 비디오까지 입력이 가능한 형태라고 합니다.

Gemini의 테크니컬 리포트 를 보면 아래와 같은 이미지가 나옵니다.

단순 텍스트 뿐만 아니라, 이미지도 입력이 가능하다보니 위와 같은 형태의 프롬프트가 가능하네요. 이렇게 되면 OCR 같은 기술들이나 이미지 캡셔닝이 따로 필요하지 않을 것 같습니다.

예견된 미래였지만, 텍스트든, 이미지든, 음성이든, 비디오든 AI의 입력 및 출력에 자유자재로 사용되는 세상이 생각보다도 역시나 더 빠르게 다가왔네요.

또 Gemini를 이용해서 AlphaCode => AlphaCode2로 강화했다고 하는데, 무려 85%의 사람보다 코딩을 잘한다고 합니다. 이렇게 되면 AlphaCode2와 같은 코드 생성 AI를 활용 잘하는 사람 한 명의 생산성이 크게 늘어날테니 개발자들 일자리가 많이 줄어들 것 같네요.

이제는 꼭 AI 쪽 개발자가 아니더라도 프롬프트 엔지니어링을 잘하는 개발자일수록 생산성이 늘어나고 경쟁력이 높아질 것 같습니다 :)