토론

업데이트된 ChatGPT-4o(옴니), 영화 'Her'의 인공지능 비서가 될까

2024.05.14

1,673
5
과학기술과 사회에 관심이 많은 연구활동가
Dall E로 필자가 직접 생성.

영화 'Her'를 보면, 사람들이 주로 음성으로 AI와 의사소통을 합니다. 이 과정에서 주인공인 테어도어는 인간처럼 반응해주는 AI '사만다'와 사랑에 빠지는데요. AI가 사람처럼 자연스럽게,빠르게 응답해 준다면 AI에게 감정을 느낄 수도 있겠다 싶죠.

한국 시간으로 2024년 5월 14일 새벽, OpenAI는 음성 비서 기능을 강화한 새로운 멀티모달모델(LMM)인 'GPT-4o'를 공개했습니다(관련 기사). 여기서 o는 모든 것이라는 '옴니'를 뜻한다고 하니, 한국어로 부르면 GPT-4 옴니 라고 불러야 할 지도 모르겠네요. 언론사들이 제목으로 '보고,듣고, 말할 수 있는 AI 등장'이라고 하는 내용은 사실과 조금 다른데요. 진작에 ChatGPT-4를 포함한 여러 AI에서 음성이나 사진, 영상을 보고 말할 수 있었기 때문입니다.


하지만 이번 모델에 와서 성능이 대폭 향상된 것은 사실입니다. 아직 일반 유저에게 공개되지는 않았지만, Chatgpt-4o를 통해 실시간으로 AI와 영상통화를 할 수 있는 것은 물론이고, 카메라를 통해 보는 정보를 실시간으로 해석해줍니다. 위에 영상에서는 표정을 읽고 해석하는 것은 물론이고, AI에게 '지금 실시간으로 너의 성능에 대해 발표하고 있어'라고 하니까 '부끄러우니 멈춰주세요' 라고까지 합니다. 영상을 보시면 목소리도 진짜 부끄러워 하는 듯 보입니다.

위 영상 외에 다른 시연 영상에서는 '목소리를 기계처럼 바꿔서 말해줘'라고 하자 기계처럼 말하는 등 자연스러운 기능이 많아졌으며, 실시간으로 사람이 AI의 말을 끊고 대화에 간섭할 수 있는 등 놀라운 기능이 많아졌습니다. 이런 기능에 대한 업데이트나 데스크톱 앱 출시 등을 점차 진행할 예정이라고 하네요.

직접 길 가다가 찍은 중국집 '시향'사진
직접 GPT-4와 진행한 질의응답
직접 GPT-4o와 진행한 질의응답
직접 GPT-4o(옴니)와 진행한 질의응답

실시간 음성 채팅은 아직 업데이트가 되지 않아 사용해보지 못했지만, 업데이트된 GPT-4o는 현재 사용해볼 수 있어 직접 성능을 비교하고자 몇 가지 실험을 해봤습니다. 우선, 이미지를 이전보다 얼마나 질 인식하는지 궁금했습니다. 이전에 GPT-4에서는 이미지 인식 기능, 특히 이미지 안의 한자 등을 읽는 OCR기능이 아쉬웠거든요. 직접 보시면 아시겠지만, GPT-4는 엉뚱한 대답을 한 반면, GPT-4o는 어떤 한자가 쓰였는지 정확히 읽어냈으며, 그 맥락을 사진 내의 다른 정보인 '옛날손짜장'을 읽어내면서 더 똑똑하게 유추하는 모습입니다.

직접 한 윤석열 기자회견 질문

그 다음으로는 웹사이트 검색 및 요약 기능을 테스트해보고자 했습니다. 이전 버젼인 ChatGPT-4도 검색은 가능했지만, 기능 측면에서 아쉬운 점이 있었거든요. 이 질문에 대한 대답 차이는 조금 길어서, 제가 각각 따로 복사해 인용하겠습니다.


- ChatGPT-4

 윤석열 대통령 취임 2주년 기자회견에 대한 한겨례와 중앙일보의 보도는 각기 다른 내용과 초점을 담고 있어, 이들 언론사의 편집 방향성이 어떻게 다른지를 잘 보여줍니다.


한겨례는 채상병 특검법과 김건희 여사와 관련된 논란 등에 대한 대통령의 책임과 투명성을 강조하는 보도를 했습니다. 이 보도는 정치적, 대중적 요구에 대해 윤 대통령이 사과하고 구체적인 조치를 취할 것을 촉구하는 내용을 중점적으로 다루면서, 민감한 사안들에 대한 대통령의 대응을 비판적으로 조명했습니다. 투명하고 반응적인 거버넌스 필요성을 강조하는 태도를 보였습니다.


반면, 중앙일보는 지난 2년 간 윤 대통령의 성과와 미래 계획에 초점을 맞추어 긍정적인 보도를 했습니다. 경제 정책, 시장 경제 안정화, 규제 장벽 감소, 그리고 특히 판매 외교 강화와 한미 안보 및 경제 동맹과 같은 국제 외교의 진전을 강조하며, 행정의 방향을 긍정적으로 전망하였습니다.


이렇게 한겨례와 중앙일보의 다른 초점은 현재 윤석열 대통령 행정부를 어떻게 해석하고 있는지에 대한 다양한 해석을 보여줍니다. 한겨례는 정치적 및 대중적 압력에 대한 행정의 반응을 검토하고, 중앙일보는 정책 성공과 미래 지향적 전략을 축하합니다. 


- ChatGPT-4o(옴니)

 윤석열 정부의 취임 2주년 기자회견에 대한 한겨레와 중앙일보의 보도를 비교해보겠습니다. 두 언론사의 보도는 각기 다른 시각에서 접근하여 다양한 해석을 제공하고 있습니다.


한겨레의 보도 요약

한겨레는 윤석열 대통령의 기자회견에 대해 비판적인 시각을 유지했습니다. 주요 내용은 다음과 같습니다:

  1. 소통 방식에 대한 비판: 한겨레는 윤 대통령의 기자회견이 일방적인 소통 방식에 머무르고 있다고 지적합니다. 기자회견에서 민감한 사안에 대한 명확한 답변을 피한 점을 비판합니다 (한겨레_세상을 보는 눈) (한겨레_세상을 보는 눈).
  2. 정책 실효성에 의문: 한겨레는 정부의 주요 정책이 실질적인 문제 해결보다는 형식적인 소통에 그치고 있다고 주장합니다. 특히 경제와 사회 정책에서 나타나는 한계점을 강조합니다 (한겨레_세상을 보는 눈).
  3. 사회적 논란: 한겨레는 김건희 여사와 관련된 논란 및 기타 사회적 이슈에 대해 윤 대통령이 충분히 해명하지 않았다고 평가합니다 (한겨레_세상을 보는 눈).

중앙일보의 보도 요약

중앙일보는 윤석열 정부의 성과를 강조하며 긍정적인 평가를 내렸습니다. 주요 내용은 다음과 같습니다:

  1. 정책 성과 강조: 중앙일보는 윤석열 대통령이 지난 2년간 경제 성장과 외교 성과를 이루었다고 강조했습니다. 특히 글로벌 중추국가 외교 강화, 경제의 체질 개선, 민간주도 성장 등을 주요 성과로 언급했습니다 (중앙일보) (중앙일보) (중앙일보) (중앙일보) (중앙일보).
  2. 미래 계획 발표: 기자회견에서 윤 대통령은 저출생 대응을 위한 기획부 신설, 사회적 약자 지원 강화, 경제적 공정성 제고 등의 미래 계획을 발표했습니다. 중앙일보는 이러한 계획들이 긍정적인 영향을 미칠 것이라고 평가했습니다 (중앙일보) (중앙일보).
  3. 김건희 여사 관련 논란에 대한 사과: 중앙일보는 윤 대통령이 김건희 여사와 관련된 논란에 대해 사과한 점을 강조하며, 대통령의 진솔한 태도를 긍정적으로 평가했습니다 (중앙일보).

보도 뉘앙스 차이

한겨레는 윤석열 대통령의 기자회견을 비판적인 시각에서 다루며, 소통 방식과 정책의 실효성에 대한 의문을 제기합니다. 한겨레는 정부의 성과보다는 문제점과 한계를 부각시키며 비판적인 입장을 유지합니다.


반면, 중앙일보는 윤석열 정부의 성과를 긍정적으로 평가하며, 기자회견에서 발표된 정책 성과와 미래 계획을 중심으로 보도합니다. 중앙일보는 대통령의 사과와 진솔한 태도를 강조하며 긍정적인 논조를 유지합니다.



이처럼 두 언론사는 각각의 시각에서 접근하여 독자들에게 다른 관점을 제공합니다. 

윤석열 취임 2주년 기자회견의 내용에 대해 잘 모르는 사람이 봐도 차이를 쉽게 느낄 정도로 ChatGPT-4와 ChatGPT-4o의 검색 및 문서 작성 성능은 큰 차이가 있습니다. 제가 느낀 차이점은 크게 세 가지 입니다.

  1. 이전과 다르게, 특정 웹사이트에 직접 들어가 검색하려는 시도를 합니다. 예를 들어 위에 질문을 받았을 때, 이전 모델인 GPT-4는 '윤석열 기자회견 한겨례'라고 검색한다면, GPT-4o는 'hani.co.kr에서 윤석열 기자회견 검색'과 같은 과정을 수행하는 게 보입니다. 물론 이 기능은 테스트해본 결과, 검색을 막아둔 웹사이트들은 진행하지 못합니다.
  2. 이전보다 더 다양한 웹사이트를 참고하려고 합니다. GPT-4의 경우 인용한 웹사이트 링크가 여러 개여도 하나의 웹사이트 내에서 여러 내용을 인용하는 경우가 많았다면, GPT-4o은 같은 중앙일보 인용이어도 최대한 다양한 기사를 인용하며 총 5가지 기사에서 정보를 인용했습니다.
  3. GPT-4에서 특정 업무를 수행할 때, 요청한 정보나 데이터가 나오는 속도가 사람이 읽는 속도보다 느린 경우가 많았는데, 지금 GPT-4o에게 일을 시키면.. 수행하고 출력하는 속도가 너무 빨라 도저히 제 읽는 속도로 따라갈 수가 없는 정도입니다. 혹시 유료버젼을 쓰고 계신 분들이라면 시도해보세요. 전혀 과장이 아님을 아실 겁니다. 바로 위에 저 내용을 조사한 후 출력하는 데 5초도 안걸렸습니다.

최근 Meta의 오픈소스인 LLaMA-3의 성능이 아주 뛰어나게 출시됐고, Antrophic사의 Claude-3의 성능이 ChatGPT-4보다 좋다는 뉴스가 나오며 OpenAI가 어떤 반격을 준비하고 있나 궁금해하던 사람이 많았을텐데, 역시 OpenAI는 대중을 실망시키지 않았습니다.

성능이 정말 많이 뛰어나고, 특히 '인간적인'교감이 가능해진 만큼 AI가 'Her'에 나오는 비서처럼 유능할 수도 있고, 'Her'에 나오는 것 처럼 AI가 가진 여러 문제점 역시 더 가시화될 수도 있습니다. 이런 내용들은 추후 다른 글로 천천히 다뤄보겠습니다.


이슈

인공지능

구독자 168명
김동현 비회원

저는 chatgpt 반대 이유는
수익성과 지식재산권의 분배때문에 공정성에 침혜되고
개개인의 자율적인 의견도 검열할수있고 차단 할수있기에.

표현의자유를 침혜한다고 보고있습니다!

해킹때문에도 그렇고.

개인적으로, 다양한 시각을 통해 정보를 얻고 판단하는 것이 중요하다고 생각합니다. 이러한 다양한 시각은 사회적인 토론과 비판적인 사고를 촉진시키며, 더 나은 결정을 내리는 데 도움이 될 수 있습니다.

요약하면, 한겨레와 중앙일보의 보도 요약은 윤석열 대통령의 기자회견에 대한 서로 다른 시각을 보여주며, 다양한 시각을 통해 정보를 얻고 판단하는 것이 중요하다고 생각합니다.

저는 뉴스 기사보다 유튜브 시연 영상을 먼저 봤는데요. 생각보다 답변 텀이 길지 않고(외국에 있는 친구와 대화하는 정도의 체감) 자연스럽게 느껴졌어요. 그동안 ai기반으로 서비스를 해온 외국어 서비스가 큰 타격을 입지 않을까 싶기도 했습니다.

검색 기능 향상도 고무적이네요. 저는 그동안 질문 후에 출처를 다시 물어보는 경우가 많았는데요. 가져와도 의심이 되던..ㅎㅎ 이번 모델은 어느 정도일지 확인해봐야겠습니다.

덕분에 AI의 최신 동향을 알 수 있었습니다. 양질의 정보에 감사드립니다. (_ _)

'인간적인 교감'을 AI는 아주 높은 퀄리티로 흉내낼 수 있고, 인간은 정말 AI와 교감할 수 있겠네요. 곰돌이인형이랑도 교감하는 게 인간이기에... 감정을 담은 목소리까지 낼 수 있는 AI라면 앞으로 어떤 파급력을 가져다줄지 흥미롭습니다.