챗GPT 구글검색 뛰어넘기 시간문제

엄청난 인기의 챗GPT

마치 사람과 대화하듯 글로 대화하는 오픈AI챗봇 '챗GPT(ChatGPT)'가 선풍적 관심을 모으고 있습니다.

2022년 11월 30일 출시 5일만에 이용자가 100만명을 넘어섰는데 100만명 돌파에 페이스북이 300일이 걸린 것을 고려하면 엄청난 속도입니다. 덕분에 오픈AI는 기업가치를 290억 달러(약 36조 원)로 평가받고 있습니다.

레시피와 프로그래밍은 물론 고등학교 수준의 에세이까지 높은 수준의 답변을 제공하면서 검색엔진을 대체할 수도 있는 획기적인 진보라고 평가되고 있습니다.

미국의 고교와 대학에서는 학생들이 챗 GPT로 과제를 대신하면서 논란도 일고 있습니다.

학생들이 챗GPT를 사용해 몇십 분 만에 에세이를 완성하면서 비판적 사고와 문제해결 능력을 오히려 떨어뜰리 수 있다는 것입니다.

그래서 뉴욕시 공립학교들은 교내 챗GPT 접근을 차단하기도 했습니다. 힘들게 배울 필요가 없어질 수 있기 때문입니다. 구글링의 필요도 없이 묻기만 하면 정리된 지식이 툭 튀어나오기 때문입니다.

이러니 한편에서는 열광하고 다른 한편에서는 우려하고 있습니다.

챗GPT가 위력적인 이유

이처럼 챗GPT가 위력적일 수 있게 된 이유부터 살펴봅시다.

오픈AI는 언어를 이해하고 구사하는 AI 언어생성모델인 GPT 시리즈를 개발해 왔습니다. 2018년 GPT-1, 2019sus 혰-2, 202년 GPT-3등 업그레이드할 때 마다 실력이 향상되었습니다. 챗GPT는 GPT-3.5모델입니다.

실력향상의 이유는 AI 모델에 사용되는 매개변수(파라미터)의 개수가 기하급수적으로 늘고 있기 때문입니다. 매개변수 개수는 AI 모델의 크기, 즉 복잡도를 보여줍니다. 개수가 많을수록 더 크고 좋은 모델입니다.

챗GPT(GPT3.5) 모델에 사용된 매개변수 개수는 대략 1750억 개로 추정됩니다.

2023년 오픈 AI가 공개할 것으로 보이는 GPT-4에서는 3.5 버전과 비교도 할 수도 없는 1조~100조 개의 매개변수가 사용될 것으로 추측되고 있어 그 정밀도가 얼마나 높아질지 가늠할 수 있습니다.

또 하나 챗 GPT가 기존 챗봇과 다른 점은 '사람의 피드백을 반영하는 강화학습'RLHF, Reinforcement Learning with Human Feedback)이 적용됐기 때문입니다.

기존 챗봇은 답이 정해져 있는 데이터를 사람들이 입력해 AI를 학습시키는 지도학습 방식이었습니다. 사람이 챗봇에게 고양이 사진을 보여주고 고양이라고 가르쳐주는 방식이었습니다.

반명 챗GPT는 인공지능 스스로 최적의 결과를 찾는 강화학습 방식이고, 특히 인간의 피드백에 반응해 훈련하는, 즉 이용자들의 실시간 대화데이터로 시행착오를 거치며 스스로 훈련하는 모델이라는 것입니다.

그래서 챗GPT는 이용자들과 대화하면서 인간이 실수를 지적하면 바로 인정하고 개선하며, 사용자가 잘 못된 질문을 할 경우에는 이의를 제기하며 바로 잡아주기도 합니다.

예를들어 "이순신이 2022년에 어떤 활약을 했는지 알려줘" 라고 물으면 "이순신은 1598년에 사망했기 때문에 2022년도에는 존재하지 않습니다" 라고 정정해 주는 식입니다.

또한 사람의 피드백을 반영하는 강화학습이기 때문에 이용자가 계속해서 대화의 맥락을 이어갈 수 있습니다.

대화가 끝나면 백지상태로 돌아가는 기존 챗봇과 달리 이전까지 대화를 기억하도록 프로그래밍이 되어있기 때문입니다. 그래서 외신들은 챗GPT가 출시되자 "가장 대화를 할만한 챗봇"이라고 평가하기도 했습니다.

일론 머스크는 "챗GPT는 소름 돋을 정도로 좋다. 인간은 뛰어난 AI를 맞이할 날이 멀지 않았다"며 극찬했습니다.

챗GPT에 대한 구글의 반응

이 때문에 일각에서는 "구글은 끝났다"는 전망까지 나오고 있습니다.

이제 구글링도 번거롭기 때문입니다. 구글 검색은 일일이 링크를 타고 들어가 검색 결과를 들여야 봐야하지만 챗GPT는 최적의 답변을 바로 보여주기 때문입니다. 여기에다 마이크로소프트가 검색엔진 빙(bing)에 챗GPT를 탑재할 수도 있다는 사실이 알려지면서 구글은 바짝 긴장하기 시작했습니다.

구글 내부에서 비상상황을 알리는 '코드 레드(CODE RED)'가 발령됐다는 보도가 대표적입니다.

구글 CEO 순다르 피차이가 최근 사내 AI회의에서 챗GPT가 구글의 검색엔진 비즈니스에 가하는 위협을 해결하라고 지시했다고 합니다.

그렇다면 구글은 검색엔진을 고사시킬 수도 있는 챗GPT에 어떻게 대응하려는 것일까요?

무엇보다 구글은 챗복을 새로운 검색 기반으로 삼을지 아니면 검색엔진을 재설계할지 결정해야 합니다.

일단 구글은 람다(LaMDA), 버트(BERT), 멈(MUM) 등 다수의 언어생성모델을 가지고 있습니다. 그 중에서 람다는 1,370억개의 매개변수를 갖고 있을 정도로 거대한 모델이기 때문에 챗GPT 못지않은 챗봇을 만들어 낼 역량은 충분하나는 평가입니다.

하지만 구글이 챗봇을 검색기반으로 바꾸는 것을 서두르지 않을 것이라는 전망입니다. 여전히 구글 총매출의 80% 이상이 광고수익이고 광고수익 대부분이 구글 검색에서 나오기 때문입니다.

반면 챗봇은 링크를 제공하지 못하기 때문에 검색에 광고를 붙이기 쉽지 않을 뿐 아니라 운영에 소요되는 비용을 감당할 이렇다 할 수익모델 자체가 아직 없습니다.

더 효율적인 GPU 등이 나오고 있기는 하지만 우리가 챗봇에 질문을 한 후 챗봇이 연산을 하는 과정에서 엄청난 운용비용이 듭니다.

그래서 오픈AI CEO 샘 알트만도 "챗GPT 운영비용이 너무 들어서 어떻게든 수익화할 방법을 찾을 것"이라고 말하기도 했습니다.

챗봇의 부족한 점

또한 챗봇은 검색엔진을 대체하기에는 아직 부족한 점이 많습니다. 바로 할루시네이션(hallucination) 이슈입니다.

할루시네이션은 환각이라는 뜻인데 AI가 존재하지 않는 환각을 보는 것처럼 없는 답변, 틀린 답변을 내 놓을 수 있다는 것입니다.

물론 챗GPT가사람의 피드백을 강화학습하며 능력을 끌어 올린다고 하지만 오픈 AI 역시 공식 블로그에서 "챗GPT가 그럴듯하지만 부정확하거나 무의미한 답변을 내놓을 수 있다" 고 경고하기도 했습니다.

"사용자가 당장 중요한 일에 챗 GPT를 의존하는 것은 실수입니다. 챗GPT는 혁신의 미리보기일 뿐이며 진실성 부분에서 해결해야 할 일이 많습니다." (오픈AI CEO 샘알트만 트위터, 2022.12.10)

"우리의 언어생성 AI가 물론 뛰어난 능력을 가지고 있습니다. 하지만 어떤 대답이 유용하고 유용하지 않은지 판단하기가 쉽지 않기 때문에 무조건 신뢰해서는 안됩니다." (오픈AI CTO 미라 무라티, 2022.12.16, MIT 테크놀로지 리뷰)

마이크로소프트 역시 2016년 언어생성 AI '테이(Tay)'를 출시했지만 인종차별, 외국인 혐오 등의 편향으로 논란이 일면서 출시 16시간만에 서비스를 닫았습니다.

메타도 과학정보에 대해 답변하는 '갤럭티카'를 선보였지만 3일만에 닫았습니다. 기사, 논문, 사전 등의 4,800만 종 과학정보를 훈련했지만 사이비 과학정보를 생성한다는 비난이 제기됐기 때문입니다.

이처럼 챗봇이 검색시장을 바꿀 잠재력을 가지고 있지만 수익모델이 없고 할루시네이션 이슈를 해결하지 못한 점을 고려할 때 구글이 당장 대화 기반의 검색으로 전환할 가능성은 작습니다.

"인터넷 사용자가 구글을 버리려면 챗GPT가 10배 더 나은 솔루션을 제공해야 합니다. 하지만 아직은 그렇지 않습니다." (모건스탠리 애널리스트 브라이언 노왁, 2022.12.15, 비즈니스인사이더)

하지만 조만간 오픈 AI가 선보일 GPT-4가 어떤 능력을 보여줄지, MS가 GPT를 접목해 검색엔진 빙을 어떻게 바꿀지에 따라 인터넷의 핵심인 검색의 대변화를 이끌 가능성도 큽니다.

(출처:티타임스)

#챗GPT #chatgpt #챗GPT구글반응 #구글반응쳇

'이슈' 카테고리의 다른 글

실내 마스크 의무 해제 1월 30일부터~ (0)	2023.01.29
챗GPT로 블로그 작성하기 (0)	2023.01.29
은관문화훈장 故 강수연, 박찬욱 감독 수훈 (1)	2022.11.25
당신의 결혼은 안녕하십니까 배우 박은혜 MC 발탁 (0)	2022.11.22
빈곤 포르노(Poverty Pornography)는 어떤 의미인가? (0)	2022.11.18