OpenAI가 기업들이 AI 에이전트를 구축하는 데 도움을 주는 새로운 도구를 출시합니다

OpenAI는 화요일에 회사의 AI 모델과 프레임워크를 사용하여 개발자와 기업이 독립적으로 작업을 수행할 수 있는 AI 에이전트를 구축하는 데 도움이 되는 새로운 도구를 공개했습니다.

이 도구들은 OpenAI의 새로운 Responses API 일부로, 기업들이 OpenAI의 Operator 제품과 유사하게 웹 검색, 회사 파일 검토 및 웹 사이트 탐색을 수행할 수 있는 사용자 정의 AI 에이전트를 개발할 수 있게 합니다. Responses API는 OpenAI의 Assistants API를 효과적으로 대체하며, 회사는 2026년 상반기에 이를 폐지할 계획입니다.

AI 에이전트에 대한 흥미는 최근 몇 년간 급격히 증가했지만 기술 산업은 사람들에게 또는 심지어 'AI 에이전트'가 정확히 무엇인지를 보여 주는 데 어려움을 겪고 있습니다. 에이전트 흥미가 유틸리티 앞서간 최근 사례에서, 중국의 스타트업 Butterfly Effect는 Manus라는 새로운 AI 에이전트 플랫폼으로 바이럴을 일으키며 회사의 약속을 많이 해헤쳤다 여깁니다.

다시 말해, OpenAI에게 에이전트를 올바르게 수행하는 게 중요하다.

'에이전트를 데모하는 것은 매우 쉽습니다,'라고 Olivier Godement, OpenAI의 API 제품 책임자가 TechCrunch와의 인터뷰에서 말했습니다. '에이전트를 확장하는 것은 꽤 어렵고, 사람들이 자주 사용하게 만드는 것은 매우 어렵습니다.'

올해 초, OpenAI는 ChatGPT에서 두 가지 AI 에이전트를 소개했습니다 : 웹 사이트를 탐색하는 Operator와 당신을 위해 연구 보고서를 편집하는 deep research. 두 도구는 에이전트 기술이 어떤 것을 달성할 수 있는지 엿볼 수 있었지만, '자율성' 부분에서 많이 부족한 것으로 나타났습니다.

이제 Responses API를 통해 OpenAI는 개발자들이 Operator 및 deep research 스타일의 에이전트 응용 프로그램을 구축할 수 있는 구성요소에 액세스를 제공하고자 합니다. OpenAI는 개발자가 오늘 사용 가능한 것보다 더 자율적인 일부 애플리케이션을 에이전트 기술로 만들 수 있기를 희망합니다.

Responses API를 사용하면 개발자들은 OpenAI의 ChatGPT Search 웹 검색 도구 아래의 동일한 AI 모델 (미리 보기 포함)을 활용할 수 있습니다 : GPT-4o 검색 및 GPT-4o mini 검색. 이러한 모델은 답변을 생성하는 동안 소스를 인용해 질문에 대한 답변을 찾기위해 웹을 둘러볼 수 있습니다.

OpenAI는 GPT-4o 검색과 GPT-4o mini 검색이 사실적으로 매우 정확하다고 주장합니다. 모델의 능력을 측정하는 SimpleQA 벤치마크에서 GPT-4o 검색은 90%의 점수를 획득하고 GPT-4o mini 검색은 88%의 점수를 획득합니다(높은 것이 좋음). 비교를 위해, 최근 출시된 OpenAI의 훨씬 큰 GPT-4.5 모델은 단지 63%를 획득합니다.

Responses API에는 회사 데이터베이스의 파일을 신속하게 검토하여 정보를 검색하는 파일 검색 유틸리티도 포함되어 있습니다.(OpenAI는 이러한 파일에서 모델을 훈련시키지 않음을 주장합니다.) 추가로, Responses API를 사용하는 개발자들은 Operator를 구동하는 Computer-Using Agent (CUA) 모델에 액세스할 수 있습니다. 이 모델은 데이터 입력 및 앱 워크플로 같은 컴퓨터 사용 작업을 자동화하기위해 마우스 및 키보드 동작을 생성합니다.

OpenAI는 기업이 CUA 모델을 선택적으로 연구 프리뷰로 자체 시스템에서 로컬로 실행할 수 있다고 밝혔습니다. Operator에서 제공되는 CUA의 소비자 버전은 웹에서만 조치를 취할 수 있습니다.

명확하게 하자면, Responses API는 현재 AI 에이전트에 영향을 미치는 모든 기술적 문제를 해결하지는 않을 것입니다.

AI 기반 검색 도구는 전통적인 AI 모델보다 정확합니다 - 적절한 답변을 찾아볼 수 있기 때문에 당연한 사실입니다 - 그러나 웹 검색은 AI 환각 문제를 해결하지 않습니다. GPT-4o 검색은 여전히 사실적인 질문의 10%를 틀리게 됩니다. 정확도 외에도, AI 검색 도구는 짧고 내비게이션 쿼리(예: '오늘의 Lakers 점수')에서 더 어려움을 겪고 있으며, 최근 보고서에 따르면 ChatGPT의 인용은 항상 신뢰할 수 없습니다.

TechCrunch에 제공된 블로그 게시물에서 OpenAI는 CUA 모델이 '운영 체제에서 작업 자동화에 대한 매우 신뢰성이 높지 않으며,' '우발적인' 실수를 할 수 있다고 밝혔습니다.

그러나 OpenAI는 이들이 에이전트 도구의 초기 버전이며, 계속 개선하기 위해 노력하고 있다고 밝혔습니다.

Responses API와 함께 OpenAI는 Agents SDK라는 오픈 소스 툴킷도 출시하며, 개발자에게 내부 시스템에 모델을 통합하고 안전장치를 설치하고 디버깅 및 최적화를 위해 AI 에이전트 활동을 모니터링하는 무료 도구를 제공합니다. Agents SDK는 지난해 OpenAI가 출시한 다중 에이전트 조작 프레임워크인 Swarm의 일종으로 볼 수 있습니다.

Godement는 OpenAI가 올해에 AI 에이전트 데모와 제품 사이의 간극을 좁히기를 희망하며, 그는 자신의 의견으로 '에이전트는 발생할 가장 영향력있는 AI 응용 프로그램'이 될 것이라고 말했습니다. 이는 OpenAI CEO Sam Altman이 지난 1월에 한 선언과 일치합니다 : 2025년은 AI 에이전트가 직장에 들어갈 해다.

2025년이 정말로 'AI 에이전트의 해'가 되는지 여부에 상관없이, OpenAI의 최신 릴리스는 회사가 화려한 에이전트 데모에서 의미있는 도구로의 전환을 원한다는 것을 보여줍니다.