Cursor Composer 2.5 가성비 후기: 실제 프로젝트에 녹여본 AI 코딩 에이전트의 현실

커서(Cursor)를 업무용으로 쓴다면 월 20달러 Pro 플랜이 가장 가성비가 좋다고 보는 개발자가 많습니다.

Cursor Pro ($20/월) 핵심 기능
무제한 Tab 자동완성
Claude, GPT, Gemini 등 최신 모델 사용 가능
Agent 모드(코드 수정, 리팩토링, 파일 생성 등)
Cloud Agents 지원
MCP, Skills, Hooks 지원
월 $20 상당의 모델 사용량 포함

왜 가성비가 좋다고 하나?
VS Code 기반
기존 VS Code 사용자라면 거의 바로 적응 가능
코드베이스 전체 이해
단순 자동완성보다 프로젝트 전체를 읽고 수정 가능
Claude Code보다 예측 가능한 비용
월정액으로 시작 가능
사용량 초과 과금은 별도 설정을 켜야 발생
Auto 모드 활용 시 사용량 효율적
일반 개발 작업은 Auto 모드만으로도 상당 부분 처리 가능하다는 평가가 많음

개발 비용 아끼려다 발견한 뜻밖의 지표, 커서 컴포저 2.5의 첫인상

개발을 하다 보면 인공지능 도구에 들어가는 고정 비용이 은근히 신경 쓰입니다. 기존 프리미엄 모델들을 연동해 쓰다 보면 토큰 소모량이 워낙 커서 한 달 요금 명세서를 볼 때마다 한숨이 나오곤 하죠. 저 역시 매달 나가는 API 비용을 조금이라도 줄여보자는 마음에 대안을 찾고 있었습니다. 그러다 최근 커서(Cursor)에서 독자적인 코딩 에이전트 모델인 '컴포저(Composer) 2.5'를 출시했다는 소식을 접했습니다. 처음에는 '중국 문샷에이아이의 오픈소스 Kimi K2.5 기반인데 성능이 나와봤자 얼마나 나오겠어?' 싶었지만, 실제로 며칠간 메인 작업에 투입해 보니 생각했던 것과 완전히 다른 수치들이 눈에 보이기 시작했습니다.



1/6 수준으로 뚝 떨어진 토큰 단가와 압도적인 가성비

가장 먼저 체감되는 변화는 비용입니다. 실제 기술 데이터에 따르면 컴포저 2.5의 요금은 일반 고속 버전 기준 입력 100만 토큰당 0.5달러, 출력 100만 토큰당 2.5달러 선으로 책정되어 있습니다. 이는 기존 시장을 리드하던 앤트로픽의 클로드 소넷이나 오퍼스 같은 프런티어 모델들과 비교했을 때 거의 6분의 1 수준에 불과한 단가입니다. 글로벌 커뮤니티인 레딧(Reddit)의 실제 사용 후기들을 살펴보아도 "하루 종일 엄청나게 코드를 짜댔는데도 단 몇 달러로 몇 시간의 작업 시간을 아꼈다"라거나 "가성비 측면에서 완전 대박(꿀)이다"라는 평이 지배적입니다. 실제로 저도 간단한 웹 애플리케이션의 API 엔드포인트를 설계하고 크론탭(Crontab) 작업을 자동화하는 과정에서 컴포저 2.5를 기본 모델로 두고 테스트해 보았는데, 비용 모니터링 페이지에 찍히는 누적 금액이 기존의 반의반도 되지 않아 심리적인 부담이 확연히 줄어들었습니다.

정밀 피드백과 합성 데이터가 만들어낸 긴 작업의 안정성

단순히 가격만 저렴하고 코드가 엉망이었다면 애초에 쓰지 않았을 겁니다. 컴포저 2.5가 이전 버전보다 확실하게 고도화되었다고 느낀 지점은 '긴 맥락을 놓치지 않는 안정성'에 있습니다. 최근 정보기술진흥원 뉴스 보도 등에서 언급된 것처럼, 이번 버전은 이전 대비 무려 25배나 많은 합성 작업 데이터를 학습했다고 합니다. 특히 '타깃형 텍스트 피드백 강화학습'을 도입해서 모델이 도구를 잘못 쓰거나 스타일 가이드를 위반한 그 '정확한 지점'에 힌트를 주어 교정하는 방식을 썼다고 하죠. 이 학습 방식 덕분인지, 수백 줄이 넘어가는 기존 엔터프라이즈 코드베이스를 통째로 읽히고 리팩토링을 지시했을 때 중간에 맥락을 잃고 헛소리를 하거나 코드를 뚝 끊어먹는 빈도가 눈에 띄게 줄었습니다. 질문을 던지면 구조를 엉망으로 만들지 않고, 기존의 아키텍처 규칙을 차분하게 지켜가며 코드를 채워 넣는 모습이 인상적이었습니다.

💡 컴포저 2.5 쓸 때 토큰 낭비 막는 설정 팁

커서 환경에서 컴포저 2.5를 구동할 때는 무조건 'Auto(자동 모드)' 토글을 비활성화하고 수동 검토 모드로 쓰는 것을 권장합니다. 개발자 디스코드에서도 나온 팁인데, 자동 모드를 켜두면 모델이 스스로 판단해 불필요한 파일까지 전부 훑으며 토큰을 과소비하는 경향이 있습니다. 딱 필요한 파일만 컨텍스트에 수동으로 지정해 주어야 비용 절감 효과를 극대화할 수 있습니다.


 

다양한 실사례: UI 컴포넌트 제작부터 멀티링궐 환경까지

현업에서 직접 써보며 가장 만족스러웠던 사례는 리액트(React)와 테일윈드(Tailwind CSS)를 활용한 대시보드 UI 제작이었습니다. 복잡한 차트 라이브러리를 연동하고 상태 관리를 꼬이지 않게 짜야 하는 작업이었는데, 소넷 모델을 썼을 때와 결과물의 품질 차이가 거의 없었습니다. 또한 컴포저 2.5는 'SWE-벤치 멀티링궐(SWE-Bench Multilingual)' 평가에서 고득점을 기록한 모델답게, 백엔드는 고랭(Golang)으로 짜고 프론트엔드는 타입스크립트(TypeScript)로 구성된 다중 언어 프로젝트에서도 유연하게 작동했습니다. "A 언어로 짜인 API 명세서를 기반으로 B 언어의 클라이언트 통신 함수를 만들어줘"라는 다단계 요청을 보냈을 때, 별도의 언어 전환 버퍼링 없이 두 언어의 특성을 정확히 살려 코드를 빌드해 내는 모습을 확인할 수 있었습니다.

완벽할 순 없다, 직접 겪은 아쉬운 점과 극복 방법

물론 찬사만 보낼 수는 없습니다. 실제 프로젝트에 깊숙이 써보니 명확한 한계점도 존재했습니다. 컴포저 2.5는 질문을 받자마자 내부적인 논리 검증이나 치밀한 계획 수립 단계(Reasoning)를 거치지 않고 곧바로 타이핑을 시작하는 성향이 강합니다. 그러다 보니 복잡한 비즈니스 로직이나 고도의 예외 처리가 필요한 도메인 지식 영역에서는 코드를 그럴듯하게 짜놓고도 구멍을 남겨두는 실수가 종종 발생합니다. 전체적인 구조는 잘 잡지만 세부 구현에서 엉뚱한 라이브러리 버전을 참조하는 식이죠.

이러한 단점을 극복하기 위한 저만의 대안은 '역할 분담 구조'입니다. 규모가 크고 복잡한 리팩토링이나 아키텍처 설계의 초안은 추론 능력이 뛰어난 제미나이(Gemini)나 클로드 오퍼스(Opus) 모델에 먼저 맡겨 큰 틀의 '설계도'를 받습니다. 그리고 그 설계도를 기반으로 실제 코드를 대량으로 양산하고 단순 반복성 기능들을 구현하는 실무 작업은 비용이 저렴한 컴포저 2.5에게 밀어붙이는 방식입니다. 이렇게 두 모델을 조합해 사용하면 전체적인 개발 퀄리티는 최상으로 유지하면서도, AI API 요금은 단독 프리미엄 모델을 쓸 때보다 50% 이상 절감하는 스마트한 타협점을 찾을 수 있습니다.



성능과 비용의 타협점을 찾는 개발자들을 위한 결론

요약하자면, 커서 컴포저 2.5는 모든 면에서 완벽한 만능 두뇌는 아닙니다. 하지만 "적당히 복잡한 중간 수준의 구현 업무"와 "대량의 UI 컴포넌트 양산 작업"에 있어서는 이만큼 무서운 가성비를 보여주는 모델이 단언컨대 없습니다. 프리미엄 모델의 비싼 비용 때문에 에이전트 기능을 마음껏 켜두지 못하고 주저했던 경험이 있다면, 이번 기회에 커서의 모델 선택지를 컴포저 2.5로 변경해 보시길 바랍니다. 지갑은 가벼워지고, 여러분의 작업 속도는 한층 더 빨라질 것입니다.


[글 핵심 요약] 커서 컴포저 2.5는 기존 프리미엄 코딩 모델 대비 약 1/6 수준의 저렴한 토큰 단가로 압도적인 가성비를 자랑합니다. 강화학습을 통해 긴 작업의 안정성을 높였으며 UI 제작 및 다중 언어 환경에서 뛰어난 효율을 보입니다. 복잡한 로직에서의 아쉬움은 고성능 추론 모델과의 협업 교차 검증을 통해 완벽히 보완할 수 있습니다.

[핵심 키워드] 커서 컴포저 2.5, AI 코딩 에이전트, 가성비 AI, 커서 요금제

[해시태그] #커서컴포저25 #Cursor #AI코딩 #코딩에이전트 #가성비AI #개발자꿀팁 #프로그래밍독학 #포트폴리오 #웹개발 #IT트렌드

ADRYTHING, AD EVERYTHING

ADRYTHING (애드리띵) 세상의 모든 흥미로운 흐름과 가치 있는 지식을 연결하는 공간입니다. 개인 개발 프로젝트 및 웹마스터 가이드를 아카이빙하는 '기술 이야기'와, 지금 이 순간 주목해야 할 '최신 트렌드'를 명확하고 직설적인 시선으로 전합니다.

댓글 쓰기

다음 이전