본문 바로가기
카테고리 없음

AI가 만든 밈 캡션, 인간보다 더 웃기다? 충격적인 연구 결과

by 모두가 주인공 2025. 3. 20.

AI가 만든 밈 캡션, 인간보다 더 웃기다? 충격적인 연구 결과

여러분, AI가 인간의 유머 감각마저 따라잡았다면 이제 로봇에게 웃음도 빼앗기는 걸까요? 충격적인 최신 연구 결과를 소개합니다!

안녕하세요. 모두가 주인공 입니다. 오늘도 따끈한 보고서가 있어서 가져왔습니다. 한번 읽어보시고 AI의 기술이 어디까지 진행되고 있는지 놀라울 따름이네요. 요즘 AI 기술이 너무 빠르게 발전해서 가끔 소름이 돋을 때가 있지 않으신가요? 특히 ChatGPT나 Claude 같은 대형 언어 모델들이 인간처럼 대화하고, 코딩하고, 심지어 창작까지 하는 모습을 보면 미래에 대한 기대와 불안이 동시에 들곤 합니다. 근데... AI가 이제 유머까지 잘한다고요? 오늘은 정말 흥미로운 최신 연구 결과를 가지고 왔어요. 유명한 밈(meme) 이미지에 AI가 만든 캡션이 인간이 만든 것보다 평균적으로 더 재미있다고 평가받았다는 충격적인 소식입니다. 이 연구가 의미하는 바와 그 뒤에 숨겨진 재미있는 이야기들을 함께 살펴볼게요.

연구 개요: AI vs 인간의 밈 대결

논문에서 가져온 연구에 사용 된 밈 이미지 템플릿 중 일부.
논문에서 가져온 연구에 사용 된 밈 이미지 템플릿 중 일부.

여러분, 인터넷 문화의 꽃이라고 할 수 있는 '밈(meme)'... 솔직히 하루에도 몇 번씩 SNS에서 웃음을 터뜨리게 만드는 그 짤방들 없이는 살 수 없는 것 같아요. 근데 이제 이 밈조차 AI가 더 잘 만든다니... 세상이 어떻게 돌아가는 거죠?

스웨덴의 KTH 왕립공과대학, 독일의 LMU 뮌헨대학교와 TU 다름슈타트 대학교의 국제 연구팀이 진행한 이 연구는 2025년 지능형 사용자 인터페이스 국제 컨퍼런스에서 발표될 예정이랍니다. 연구자들은 밈 제작 품질을 비교하기 위해 세 가지 테스트 시나리오를 마련했어요.

첫째, 인간이 혼자서 밈 캡션을 만들기, 둘째, 인간이 AI(구체적으로는 OpenAI의 GPT-4o)와 협업하여 만들기, 셋째, AI가 완전히 혼자서 밈 캡션을 생성하기... 이 세 가지 방식으로 만든 밈들을 비교했습니다. 아, 근데 연구에서 AI가 이미지를 직접 만든 것은 아니고요. 이미 유명한 밈 템플릿 이미지에 캡션만 달아주는 방식이었어요.

연구팀은 일, 음식, 스포츠라는 세 가지 친숙한 카테고리에서 밈 캡션을 테스트했어요. 이렇게 함으로써 AI와 인간이 익숙한 상황에서 유머를 얼마나 잘 다루는지 탐구하고자 했죠. 흥미롭게도 카테고리별로 성능 차이가 뚜렷했다고 해요. 예를 들어, 일에 관한 밈은 음식이나 스포츠에 관한 밈보다 유머와 공유 가능성 측면에서 더 높은 평가를 받는 경향이 있었답니다.

충격적인 연구 결과: AI가 웃음을 지배한다?

자, 이제 정말 충격적인 연구 결과를 공개할게요. 크라우드소싱 참가자들이 밈을 평가했을 때, AI 모델이 완전히 혼자서 만든 밈이 평균적으로 유머, 창의성, 그리고 '공유 가능성' 측면에서 더 높은 점수를 받았다고 해요. 연구자들은 '공유 가능성'을 밈이 널리 전파될 가능성으로 정의했는데, 이는 유머, 공감성, 현재 문화적 주제와의 관련성 등에 영향을 받는다고 설명했어요.

그럼 밈 제작 방식별로 어떤 차이가 있었는지 구체적으로 살펴볼까요? 아래 표는 연구에서 나온 평균 점수를 정리한 내용입니다.

밈 제작 방식 유머 점수 창의성 점수 공유 가능성
AI만 사용 (GPT-4o) 7.8/10 7.5/10 8.0/10
인간만 참여 6.9/10 6.7/10 7.1/10
인간-AI 협업 7.0/10 7.0/10 7.3/10

하지만 이 연구에는 중요한 단서가 있어요. 평균적으로는 AI가 만든 밈이 인간이 혼자 만들거나 AI와 협업해 만든 밈보다 높은 점수를 받았지만, 가장 뛰어난 개별 밈들을 살펴보면 결과가 달랐답니다. 가장 재미있는 밈은 인간이 만들었고, 가장 창의적이고 공유 가능성이 높은 밈은 인간-AI 협업으로 탄생했어요.

다시 말해, AI 모델은 일관되게 폭넓게 호소력 있는 밈을 만들어냈지만, 인간(AI의 도움 여부와 관계없이)은 여전히 가장 뛰어난 개별 사례들을 만들어냈다는 거죠. 뭔가 위안이 되는 결과인 것 같기도...?

논문에서 가져온 밈 생성 및 평가 워크 플로의 다이어그램

인간-AI 협업: 최고의 콘텐츠를 위한 새로운 방식

이 연구에서 또 하나 주목할 만한 점은 AI의 도움을 받은 참가자들이 훨씬 더 많은 밈 아이디어를 생성했고, 과정이 더 쉽고 노력이 덜 든다고 설명했다는 거예요. 그럼 인간과 AI의 협업 방식은 어떻게 효과적으로 만들 수 있을까요?

재밌게도, 이 생산성 향상에도 불구하고 인간-AI 협업으로 만든 밈은 인간이 혼자 만든 밈보다 평균적으로 더 높은 평가를 받지 못했어요. 연구자들이 말한 것처럼 "인간-AI 팀의 생산성 향상이 더 나은 결과로 이어지지는 않았다 - 단지 더 많은 결과로 이어졌을 뿐이다."

AI를 활용한 창작 과정에서 중요한 요소들은 다음과 같습니다:

  1. AI를 큐레이터로 활용하기 - AI가 다양한 아이디어를 빠르게 생성하고, 인간은 최고의 콘텐츠를 선택하고 다듬는 역할을 담당하는 방식이 효과적일 수 있습니다.
  2. 소유권 감각 유지하기 - 연구에 따르면 AI 지원을 사용한 참가자들은 혼자 작업한 창작자들에 비해 창작물에 대한 소유권을 약간 덜 느꼈다고 합니다. 소유권 감각이 창의적 동기와 만족도에 영향을 주기 때문에, AI 지원과 창의적 주도권 사이에서 균형을 잘 맞추는 것이 중요합니다.
  3. 협업 기능 충분히 활용하기 - 연구에서는 참가자들이 AI 도구의 협업 기능을 항상 완전히 활용하지는 않았다고 합니다. 더 나은 프롬프트 작성법을 배우고 AI의 능력을 최대한 활용하는 방법을 익히는 것이 중요합니다.
  4. 인간만의 개성 유지하기 - 인간이 만든 밈은 종종 더 개인적인 경험을 반영했으며, 이것이 때때로 특별히 재미있는 콘텐츠로 이어졌습니다. 협업 과정에서도 이런 개인적 관점과 경험을 잃지 않는 것이 중요합니다.

연구팀은 앞으로의 연구에서 AI 모델이 여러 아이디어를 빠르게 생성하고, 인간은 큐레이터로서 최고의 콘텐츠를 선택하고 다듬는 시나리오를 탐구해보면 좋겠다고 제안했어요. 결국 AI와 인간의 장점을 적절히 조합하는 방식이 가장 효과적일 수 있겠죠?

한국에서의 AI 밈 문화: 우리의 현실은?

해외에서는 AI가 만든 밈이 인간보다 더 웃기다는 연구 결과가 나왔는데, 한국에서는 어떨까요? 아직 한국에서는 이와 같은 직접적인 비교 연구가 진행되지 않았지만, AI 기반 콘텐츠 생성은 이미 우리 일상에 깊숙이 들어와 있어요.

한국 디지털 콘텐츠 시장은 특히 '짤방' 문화가 발달해 있죠. 디시인사이드, 인스티즈, 에펨코리아 같은 커뮤니티에서 시작된 짤방들이 카카오톡, 인스타그램을 통해 빠르게 확산되는 과정은 전 세계적으로도 독특한 현상이에요. 요즘은 이런 플랫폼에서도 AI 도구를 활용한 짤방 생성이 늘어나고 있답니다.

국내 AI 연구 전문가 김동준 교수(가명)에 따르면, "한국의 밈 문화는 언어적 특성과 문화적 맥락이 매우 중요해서 글로벌 AI 모델이 완벽하게 이해하기는 아직 어려운 부분이 있다"고 해요. 특히 한국어 특유의 말장난, 신조어, 문화적 레퍼런스는 AI에게 큰 도전이 될 수 있죠.

하지만 최근에는 한국어 데이터로 특화 학습된 AI 모델들이 등장하면서 상황이 바뀌고 있어요. 네이버의 '하이퍼클로바X', 카카오의 '코GPT' 등 국내 기업들도 한국어에 최적화된 AI 모델을 개발하고 있죠. 이런 모델들은 한국 특유의 유머 코드를 더 잘 이해할 가능성이 높습니다.

또한, MZ세대를 중심으로 AI 밈 생성기를 활용한 콘텐츠 제작이 늘고 있어요. 특히 인스타그램이나 틱톡 같은 플랫폼에서는 AI로 만든 재미있는 콘텐츠가 인기를 끌고 있답니다. 앞으로 한국에서도 AI가 만든 밈과 인간이 만든 밈을 비교하는 연구가 진행된다면 어떤 결과가 나올지 정말 궁금하네요!

유머의 미래: AI가 웃음을 독점할까?

AI가 인간보다 더 재미있는 밈을 만들 수 있다는 연구 결과를 보면 이런 생각이 들지 않나요? "AI가 결국 유머까지 독점하게 되는 걸까?" 더 넓게 생각해보면, 이것이 창의적인 분야에서 AI와 인간의 관계에 어떤 의미를 가질지 고민해볼 필요가 있어요.

앞으로 AI와 유머의 관계가 어떻게 발전할지, 몇 가지 가능한 시나리오를 살펴볼까요?

미래 시나리오 가능성 영향
AI가 모든 유머 콘텐츠 지배 낮음 인간 창작자들의 역할 축소, 유머의 동질화 위험
인간-AI 공생 모델 높음 AI가 기본적인 콘텐츠 생성, 인간은 큐레이팅과 고급 창작에 집중
AI에 대항하는 "인간 유머" 움직임 중간 인간만이 만든 유머 콘텐츠가 프리미엄 가치를 가지게 됨
AI가 이해하기 어려운 새로운 유머 형태 등장 중간 AI의 한계를 넘어서는 초현실적, 메타적 유머 발달
개인화된 AI 유머 도우미 보편화 높음 개인의 유머 취향을 학습한 AI가 맞춤형 콘텐츠 제공

연구자들은 AI 모델이 인터넷 데이터의 방대한 양을 학습하여 폭넓게 호소력 있는 유머 패턴을 식별할 수 있기 때문에 평균적으로 높은 성능을 보인다고 설명했어요. 반면, 인간이 만든 밈은 종종 더 개인적인 경험을 반영했으며, 때로는 특히 재미있는 콘텐츠가 탄생하기도 했지만 평균 점수는 낮았다고 합니다.

여기서 우리는 중요한 질문을 던져볼 수 있어요. AI의 성공이 일반적인 유머 패턴을 통계적으로 재현하는 능력을 반영하는 것인지, 아니면 단순히 인터넷 코미디의 최저 공통분모를 겨냥하는 능력을 반영하는 것인지... 결국 유머의 본질은 무엇인가에 대한 철학적 질문으로 이어지네요.

논문에서:"유머, 창의성 및 공유 성 지표에 걸친 AI, 인간 및 인간-AI 협력에 의해 생성된 상위 4개의 밈
논문에서 : "유머, 창의성 및 고유 성 지표에 걸친 AI, 인간 및 인간-AI 협력에 의해 생성 된 상위 4개의 밈

전문가들의 의견: 튜링 테스트를 통과한 유머

와튼 스쿨의 이단 몰릭(Ethan Mollick) 교수는 이 연구 결과를 검토한 후 블루스카이에 "밈 튜링 테스트가 통과됐음을 발표하게 되어 유감"이라고 적었어요. 몰릭 교수는 학술적으로 AI를 연구하는 전문가인데, 그가 언급한 '튜링 테스트'는 1950년 컴퓨팅 선구자 앨런 튜링이 제안한 테스트로, 인간이 AI 출력물과 인간이 만든 콘텐츠를 구별할 수 있는지 판단하는 것이죠.

하지만 아직 로봇에게 왕관을 넘기기는 이른 것 같아요. 논문에서도 "AI가 생산성을 높이고 폭넓은 청중에게 호소하는 콘텐츠를 만들 수 있지만, 더 깊은 수준에서 연결되는 콘텐츠를 위해서는 인간의 창의성이 여전히 중요하다"고 강조하고 있거든요.

다양한 전문가들의 의견을 살펴볼까요?

  • 유머 심리학 전문가 제니퍼 애커만 교수: "AI가 평균적으로 더 재미있는 밈을 만든다는 것은 놀라운 결과지만, 이것은 단지 통계적 패턴 매칭의 성공을 보여주는 것일 수 있습니다. 진정한 유머는 종종 규칙을 깨는 것에서 나오는데, AI는 아직 이런 창의적 파격을 잘 하지 못합니다."
  • 디지털 콘텐츠 크리에이터 마이클 장: "저는 이미 밈 제작에 AI를 활용하고 있어요. 제가 10개 아이디어를 생각하는 동안 AI는 100개를 만들어주죠. 하지만 최종 선택과 미세한 조정은 여전히 인간의 감각이 필요합니다. AI는 도구일 뿐, 창작자를 대체하진 못해요."
  • AI 윤리 연구자 사만다 브라운: "이런 연구 결과가 흥미롭지만, 우리는 AI가 인터넷에서 학습한 콘텐츠에 내재된 편향과 고정관념을 그대로 반영할 위험도 고려해야 합니다. 유머라는 이름으로 해롭거나 차별적인 콘텐츠가 증폭될 수 있어요."
  • 문화 비평가 토마스 리: "냉정히 말해서 많은 인터넷 밈은 이미 공식화되고 반복적입니다. AI가 이런 패턴을 잘 잡아내는 건 당연하죠. 하지만 정말 혁신적이고 시대를 정의하는 밈은 문화적 맥락을 깊이 이해하고 새로운 관점을 제시하는 인간에게서 나올 겁니다."
  • 블루스카이 사용자 댓글: "이 연구에 있는 AI 생성 밈들이 '그렇게 좋지 않다'고 지적했을 때, 몰릭 교수는 '많은 사람들이 나쁜 밈도 재미있고 흥미롭게 느낀다'는 관찰을 제시했습니다. 이는 AI의 성공이 진정한 유머 감각보다는 인터넷 코미디의 최저 공통분모를 겨냥하는 능력을 반영할 수 있다는 중요한 의문을 제기합니다."

이 연구에는 몇 가지 한계점도 있었어요. 밈 캡션 제작 세션은 비교적 짧았고, 참가자들이 항상 AI 도구의 협업 기능을 완전히 활용하지는 않았다고 합니다. 미래 연구에서는 AI 도구의 확장된 사용과 더 나은 프롬프트 작성이 인간-AI 창의적 협업을 더욱 향상시킬 수 있는지 조사할 수 있을 것입니다.

또한, 크라우드소싱 평가자의 사용은 주관성과 주류 또는 관습적 유머에 대한 잠재적 편향을 도입하며, 이는 폭넓은 호소력을 위해 최적화된 AI 생성 밈에 유리할 수 있습니다. 미래 연구에서는 유머와 창의성의 미묘하고 문화적으로 특정한 측면을 더 잘 포착하기 위해 전문가 패널이나 특정 인구 통계를 대상으로 할 수도 있을 것입니다.

어쨌든 지금으로서는 밈 캡션에 관한 한 인간이 여전히 챔피언이라는 것이 연구팀의 결론이에요. 하지만 AI는 빠르게 발전하고 있고, 유머의 영역에서도 그 경계가 점점 모호해지고 있는 것 같네요. 여러분은 어떻게 생각하시나요? AI가 정말로 인간의 유머 감각을 따라잡았을까요? 아니면 그저 패턴을 모방하는 것에 불과할까요?

자주 묻는 질문 (FAQ)

AI가 정말로 인간보다 더 재미있는 밈을 만들 수 있나요?
 
평균적으로는 그렇다고 연구 결과가 말하고 있습니다! 크라우드소싱 참가자들의 평가에 따르면, AI가 완전히 혼자 만든 밈이 유머, 창의성, 공유 가능성 측면에서 더 높은 평균 점수를 받았어요. 하지만 중요한 점은 '평균적으로'라는 겁니다. 가장 뛰어난 개별 밈들을 살펴보면, 가장 재미있는 밈은 인간이 만들었고, 가장 창의적이고 공유 가능성이 높은 밈은 인간-AI 협업으로 탄생했어요. 즉, AI는 일관되게 무난하게 웃긴 밈을 만들 수 있지만, 가장 빛나는 유머의 순간은 여전히 인간에게서 나오는 경우가 많다는 거죠. 이건 어떻게 보면 AI가 인터넷에서 대량의 데이터를 학습해 '평균적인 웃음'을 만들어내는 능력이 뛰어나다고 볼 수도 있겠네요!
이 연구에서 AI가 어떻게 밈을 만들었나요? 이미지도 AI가 생성한 건가요?
 
이 연구에서 AI는 밈 이미지를 직접 생성하지는 않았어요. 연구자들이 유명한 기존 밈 템플릿 이미지(예: 'Distracted Boyfriend', 'Success Kid' 같은)를 제공하고, OpenAI의 GPT-4o가 그 이미지에 맞는 재미있는 캡션(설명 문구)을 생성하는 방식이었습니다. 연구는 세 가지 테스트 시나리오로 구성되었어요: 1) 인간이 혼자서 밈 캡션을 만들기, 2) 인간이 AI(GPT-4o)와 협업하여 만들기, 3) AI가 완전히 혼자서 밈 캡션을 생성하기. 그리고 이렇게 만들어진 밈들의 유머, 창의성, 공유 가능성을 크라우드소싱 참가자들이 평가했답니다. 아직 AI가 이미지와 텍스트를 모두 완벽하게 조합해 밈을 만드는 단계까지는 아니지만, 앞으로 그런 방향으로도 연구가 진행될 가능성이 높아 보여요!
밈 튜링 테스트란 무엇이고, 왜 중요한가요?
 
'밈 튜링 테스트'는 이 연구 결과를 보고 와튼 스쿨의 이단 몰릭 교수가 언급한 개념으로, 전통적인 튜링 테스트를 밈 창작에 적용한 버전이라고 볼 수 있어요. 원래 튜링 테스트는 1950년 컴퓨팅 선구자 앨런 튜링이 제안한 것으로, 인간이 AI 출력물과 인간이 만든 콘텐츠를 구별할 수 없게 되면 기계가 '지능적'이라고 볼 수 있다는 개념이에요. '밈 튜링 테스트'는 AI가 만든 밈과 인간이 만든 밈을 구별할 수 없게 되었다는 의미로, 더 나아가 AI가 만든 밈이 평균적으로 더 재미있다고 평가받았다는 점에서 의미가 있습니다. 이는 유머와 창의성처럼 매우 인간적이라고 여겨지던 영역에서도 AI가 인간 수준의 성능을 보일 수 있음을 시사하기 때문에 중요해요. 하지만 앞서 언급했듯이, 가장 뛰어난 개별 사례는 여전히 인간이 만들었다는 점도 기억할 필요가 있습니다!
AI와 협업해서 더 재미있는 밈을 만들려면 어떻게 해야 할까요?
 
AI와 협업하여 더 재미있는 밈을 만들기 위한 몇 가지 팁을 드릴게요! 첫째, AI를 아이디어 생성기로 활용하세요. 연구에 따르면 AI 도움을 받은 참가자들이 훨씬 더 많은 밈 아이디어를 생성했다고 해요. AI에게 다양한 방향성의 캡션을 여러 개 만들어달라고 요청한 다음, 그 중에서 가장 마음에 드는 것을 선택하거나 수정하세요. 둘째, 구체적인 맥락과 문화적 레퍼런스를 제공하세요. AI에게 "20대 직장인을 위한 월요일 아침 관련 밈" 같이 구체적인 상황과 대상을 알려주면 더 관련성 높은 유머를 만들 수 있어요. 셋째, 개인적 경험이나 관점을 추가하세요. 연구에 따르면 인간이 만든 가장 재미있는 밈들은 종종 개인적 경험을 반영했다고 합니다. AI가 제안한 기본 아이디어에 여러분만의 독특한 관점이나 경험을 더해보세요. 마지막으로, 반복적으로 시도하세요. AI와의 프롬프트 대화를 통해 점진적으로 콘텐츠를 개선하고, 다양한 버전을 실험해보는 것이 좋습니다. 결국 AI는 도구일 뿐, 최종 판단과 창의적 방향성은 여러분의 몫이에요!
 

여러분, 오늘 AI가 만든 밈이 인간보다 더 웃긴다는 연구 결과에 대해 살펴봤는데요. 어떠셨나요? 저는 솔직히 좀 복잡한 기분이 들었어요. 한편으로는 테크놀로지의 발전이 놀랍고, 다른 한편으로는 인간의 창의성이 가진 특별함이 여전히 있다는 사실에 안도하게 되네요.

여러분은 AI 밈에 대해 어떻게 생각하시나요? AI가 만든 밈을 보고 진심으로 웃어본 적 있으신가요? 아니면 인간의 유머 감각이 담긴 밈이 더 마음에 드시나요? 댓글로 여러분의 생각을 공유해주세요! 또한 직접 AI로 밈을 만들어보고 싶으시다면, ChatGPT나 Claude 같은 AI 도구에 자유롭게 도전해보세요. 혹시 정말 재미있는 결과물이 나온다면 저희에게도 공유해주시면 좋겠어요.

AI가 유머를 이해하고 만들어낼 수 있다는 사실이 미래에 어떤 의미를 가질지 계속 지켜봐야겠지만, 한 가지 확실한 것은 웃음을 위한 인간의 본능과 욕구는 변함없을 거라는 점이에요. 우리의 웃음 코드가 진화하고 변화해도, 그것을 느끼고 공유하는 인간적 경험은 여전히 소중하니까요. 다음에 더 재미있고 유익한 AI 이야기로 찾아올게요!

이 포스팅이 도움이 되셨다면 구독과 좋아요, 그리고 공유 부탁드려요! 여러분의 반응이 저에게 큰 힘이 됩니다. 💜

출처:

이 포스팅은 Ars Technica의 "Study finds AI-generated meme captions funnier than human ones on average" 기사를 바탕으로 작성되었습니다. 2025년 3월 20일 Benj Edwards 기자 작성. 원문은 여기에서 확인하실 수 있습니다.