Welcome to the Gemini Era
Welcome to the Gemini Era
Google이 드디어 OpenAI에 대한 반격을 시작한걸까요?
구글이 ‘Gemini’라는 이름의 초거대 모델을 갑작스럽게 공개했습니다. MMLU 벤치마크에서 GPT-4를 넘으며, 32개 중 30개에서 SOTA를 달성했다고 하네요.
그리고 멀티모달 모델이여서 텍스트뿐만 아니라 음성, 이미지, 비디오까지 입력이 가능한 형태라고 합니다.
Gemini의 테크니컬 리포트 를 보면 아래와 같은 이미지가 나옵니다.
단순 텍스트 뿐만 아니라, 이미지도 입력이 가능하다보니 위와 같은 형태의 프롬프트가 가능하네요. 이렇게 되면 OCR 같은 기술들이나 이미지 캡셔닝이 따로 필요하지 않을 것 같습니다.
예견된 미래였지만, 텍스트든, 이미지든, 음성이든, 비디오든 AI의 입력 및 출력에 자유자재로 사용되는 세상이 생각보다도 역시나 더 빠르게 다가왔네요.
또 Gemini를 이용해서 AlphaCode => AlphaCode2로 강화했다고 하는데, 무려 85%의 사람보다 코딩을 잘한다고 합니다. 이렇게 되면 AlphaCode2와 같은 코드 생성 AI를 활용 잘하는 사람 한 명의 생산성이 크게 늘어날테니 개발자들 일자리가 많이 줄어들 것 같네요.
이제는 꼭 AI 쪽 개발자가 아니더라도 프롬프트 엔지니어링을 잘하는 개발자일수록 생산성이 늘어나고 경쟁력이 높아질 것 같습니다 :)
Subscribe to SOOFTWARE
Get the latest posts delivered right to your inbox