XNUMXD덴탈의 23일 구글 I/O 꽤 짜릿했다! 인공 지능 분야에서 그들은 몇 가지 중요한 발전을 제시했습니다.
OpenAI의 GPT-4와 Google의 Gemini 간의 경쟁은 가장 중요한 공개 중 하나였습니다. 그들의 기존 후에 손바닥 2 시스템에서 Gemini는 다음 세대의 대규모 언어 모델(LLM)입니다.
기계 학습 모델은 Google에 의해 향상되어 더욱 정교해졌습니다. Microsoft의 Bing 개선 사항과 경쟁하기 위해 Android에 생성 AI 기능을 추가하고 AI로 Google 검색을 강화하고 있습니다.
Google Bard를 다른 제품과 비교하여 더 경쟁력 있게 만들기 위해 ChatGPT와 같은 챗봇, 그들은 이벤트 기간 동안 상당한 개선을 발표했습니다. Bard는 결국 한국어와 일본어를 포함하여 40개 이상의 언어를 지원할 것입니다. 이 확장을 통해 Bard는 어디에서나 개발자를 지원할 수 있습니다.
또한 사용자 요청에 대한 응답을 개선하기 위해 Bard는 이제 사진, 지도 및 기타 그래픽을 제공합니다. 모든 개발자에게 엄청난 도움이 될 것입니다. 여기에서는 LLM Gemini의 세부 사항을 살펴보겠습니다.
쌍둥이 자리 란 무엇입니까?
에 따르면 구글, Gemini는 처음부터 도구와 API를 연결하는 측면에서 매우 효율적이고 메모리 및 계획과 같은 미래의 발전에 대비할 수 있는 다중 모드를 목표로 했습니다. Google은 블로그 게시물에서 Gemini가 이전 모델에는 없었던 뛰어난 멀티모달 기능을 이미 갖추고 있다고 밝혔습니다.
구글은 "안전을 위해 제미니를 미세 조정하고 철저하게 테스트하면 PaLM 2와 유사한 다양한 크기와 기능으로 제공할 것"이라고 말했다.
결과적으로 여러 제품, 앱 및 장치에 구현되어 모든 사람에게 혜택을 줄 수 있습니다.”
이들은 이번 컨퍼런스에서 다국어, 추론, 코딩 기능이 확장된 최첨단 언어 모델인 PaLM 2를 선보였습니다. 100개가 넘는 언어의 다국어 자료로 광범위하게 훈련되었습니다.
PaLM 2는 관용구, 시, 수수께끼와 같은 미묘한 콘텐츠를 다양한 언어로 생성하고 번역할 수 있습니다.
Gemini는 Google의 AI 노력을 강화하고 개척자인 OpenAI의 ChatGPT에 도전할 가능성이 높습니다. ChatGPT는 주로 텍스트 기반 대화에 사용되지만 Gemini는 멀티모달이므로 텍스트와 시각적 요소 모두에 응답할 수 있습니다. Google 검색과 통합되면 소비자가 인기 있는 검색 엔진과 상호 작용하는 방식을 변화시킬 수 있습니다.
Gemini에 대한 자세한 내용은 아직 제공되지 않지만 ChatGPT 및 Bing AI를 능가하여 Google을 AI 분야의 선두로 끌어올릴 수 있습니다.
순다르 피차이 구글 최고경영자(CEO)는 컨퍼런스에서 “AI 퍼스트 기업이 된 지 XNUMX년 만에 우리는 흥미진진한 전환점에 와 있다”고 말했다.
Pichai에 따르면 Gemini는 현재 훈련을 받고 있으며 매우 효과적이며 기억력 및 계획과 같은 미래의 발전을 위한 문을 여는 것을 목표로 다중 모드 접근 방식으로 만들어지고 있습니다. Pichai에 따르면 Gemini는 아직 초기 단계이지만 이전 버전에는 없었던 뛰어난 다중 모드 기능을 이미 과시하고 있습니다.
Google은 TPU(칩)를 통해 Gemini에 지시합니다. Pichai는 Gemini가 최적화되고 안전 검사를 통과한 후에 특정 출시 날짜는 언급되지 않았지만 다양한 크기와 용량으로 액세스할 수 있을 것이라고 말했습니다.
Pichai는 Google의 모든 AI 모델이 잘못된 정보의 확산을 방지하기 위해 사진과 같은 출력물에 워터마킹 및 메타데이터를 통합할 것임을 분명히 했습니다.
Gemini가 우월한 이유 ChatGPT 그리고 BingAI?
Gemini에는 몇 가지 흥미로운 "다중 모드" 특성이 있습니다. 텍스트만 읽고 생성할 수 있는 ChatGPT와 달리 Gemini는 멀티모달 패러다임을 기반으로 텍스트, 코드 및 그림을 이해하고 생성할 수 있습니다.
이렇게 다양한 기술을 통해 수많은 기회를 얻을 수 있습니다. 예를 들어 Gemini는 텍스트와 시각적 요소를 모두 이해하고 반응할 수 있는 새로운 종류의 AI 챗봇을 만드는 데 사용할 수 있습니다.
그러나 ChatGPT와 Bing은 모두 텍스트 기반 통신만 제공하며 Bing은 이미지 생성을 위한 별도의 링크를 제공하지만 채팅 내 사진 지원이 부족합니다.
Gemini는 ChatGPT와 달리 더 다양한 제품과 애플리케이션을 처리할 수 있습니다. 예를 들어 Google 검색을 업그레이드하거나 AI를 사용하는 최첨단 가상 도우미를 만드는 데 사용할 수 있습니다. 이러한 기능은 BingAI 및 ChatGPT에 없습니다. 그러나 ChatGPT는 결과를 향상시키는 플러그인을 제공합니다.
Gemini는 또한 메모리 및 계획과 같은 특성을 가지고 있어 ChatGPT가 할 수 있는 것 이상으로 AI 기반 앱을 개발할 수 있습니다.
선호 사항을 추적하고 일일 계획을 돕는 Gemini 기반의 개인 비서를 갖는 것을 고려할 때 흥미로운 가능성이 생깁니다. 그러나 Gemini의 모든 잠재력을 보고 그것이 열어주는 기회를 조사하려면 먼저 공개 출시를 초조하게 기다려야 합니다.
결론
Google의 차세대 언어 모델인 Gemini는 텍스트 전용 라이벌인 ChatGPT보다 적응력이 뛰어난 뛰어난 다중 모드 기능을 보여주었습니다.
Gemini는 챗봇과 AI 앱이 텍스트, 코드 및 그래픽을 읽고 생성할 수 있도록 함으로써 새로운 기회를 창출합니다. 이러한 애플리케이션은 이제 더 넓은 범위의 활동을 관리할 수 있습니다. 이미지와 다중 모드 상호 작용을 모두 지원하는 Gemini와 달리 ChatGPT와 BingAI는 텍스트 기반 상호 작용만 가능합니다.
Gemini에 대한 보다 구체적인 정보는 아직 공개되지 않았지만 Google이 AI 기술을 발전시키고 이 분야에서 선두를 유지하기 위해 노력하고 있음은 분명합니다.
공식적인 출시를 기대하며 Gemini의 잠재력과 창조적인 가능성이 열리기를 기대합니다.
댓글을 남겨주세요.