다음과 같은 대규모 언어 모델 이해하기 ChatGPT: 과대광고를 극복하다

대규모 언어 모델이란 무엇입니까?

ChatGPT 웅변적이고 미묘한 자연어 생성으로 사람들을 눈부시게 하며 세상을 폭풍으로 몰아넣었습니다. 그러나 표면적으로는 인상적이지만, 내부를 살펴보면 주목할만한 약점이 드러납니다.

이 게시물에서는 다음과 같은 대규모 언어 모델(LLM)의 내부 작동 방식을 설명하겠습니다. ChatGPT. 나의 목표는 최근 AI 발전에 관해 사실과 허구를 분리하는 권위 있는 분석입니다.

LLM 작동 방식: 동시 약속과 한계 이해

대규모 언어 모델이란 무엇입니까?

그렇다면 LLM은 정확히 무엇이고 모델은 어떤가요? ChatGPT 작동하다? 간단히 말해서:

  • LLM은 대규모 텍스트 데이터 세트를 수집하여 매우 유창한 인간 언어를 예측할 수 있습니다.
  • 그러나 인간과 달리 LLM은 현실 세계에 대한 이해력, 추론 및 사실 기반이 부족합니다.
  • 따라서 아름답게 세련된 텍스트를 생성할 수는 있지만 일관성, 정확성 또는 건전한 논리적 기반이 부족한 경우가 많습니다.

LLM의 메커니즘과 한계를 더 자세히 살펴보겠습니다.

LLM은 자신이 생성한 단어를 실제로 이해하지 못합니다.

LLM의 강점과 결점을 이해하는 열쇠는 교육 방법론에 있습니다.

  • 그들은 웹사이트, 책, 기사 등에서 최대 수천억 개의 단어를 수집합니다.
  • 단어 패턴을 감지하여 잠재적인 시퀀스에 대한 확률을 학습합니다.
  • 이를 통해 해당 언어 패턴에 맞는 새로운 조합을 생성할 수 있습니다.

그러나 해당 단어에는 암호화된 의미가 첨부되어 있지 않습니다. 이전 사례를 기반으로 시퀀스를 단순히 예측했습니다.

따라서 설득력이 있지만 배후에서 일어나는 진정한 이해나 추론은 없습니다. 그리고 이는 LLM의 눈에 띄는 사실적 오류와 논리적 격차를 설명합니다.

LLM은 실제 세계에서의 접지가 부족합니다.

또한 LLM은 훈련 중에 텍스트 코퍼스만 수집하기 때문에 현실이 어떻게 작동하는지에 대한 실제 지식이 부족합니다.

따라서 다음과 같은 모델이 표시하는 "사실"이나 "지식"은 ChatGPT 얕고 부정확합니다. 진실에 기반을 두기보다는 단어 패턴을 조합하여 만든 것입니다.

이러한 추론과 사실 기반의 부족은 LLM의 악명 높을 정도로 부정확하거나 무의미한 진술을 설명합니다. 그들의 반응은 놀랍게 들릴 수도 있지만 완전한 허구인 경우가 많습니다.

일관된 정체성이나 신념 체계가 없습니다.

마지막으로, LLM에는 응답을 하나로 묶는 지속적인 ID가 부족합니다.

  • 인간은 시간이 지남에 따라 주제에 대한 응집력 있는 신념과 성실성을 발전시킵니다.
  • LLM은 다음과 같습니다 ChatGPT 일관성 없이 독립적으로 각 응답을 생성합니다.
  • 따라서 질문을 통해 조사해 보면 노골적인 모순을 보게 될 것입니다.

LLM 결과는 개별적으로 일관되고 지능적으로 보일 수 있습니다. 그러나 더 나아가면 그들의 결점이 분명해집니다.

마무리 생각: 과대광고에 직면한 측정된 낙관주의

자연어 AI의 급속한 발전이 인상적이다. 좁은 응용 분야에서는 다음과 같은 도구가 사용됩니다. ChatGPT 약속을 보여주세요.

그러나 인간 수준의 지능에 대한 과장된 주장은 시기상조인 것 같습니다. LLM은 많은 발전을 이루었지만 여전히 생물학적 인지와 관련된 근본적인 제약에 직면해 있습니다.

흥분은 당연하지만 과대광고는 자제해야 합니다. 앞으로의 길은 아직 멀지만 LLM은 미래의 가능성을 살짝 엿볼 수 있는 기회를 제공합니다.

다음과 같은 대규모 언어 모델 이해하기 ChatGPT: 과대광고를 극복하다

댓글을 남겨주세요.

귀하의 이메일 주소는 공개되지 않습니다. *표시항목은 꼭 기재해 주세요. *

맨 위로 스크롤