AI·자동화

AI 명령 잘하는 법: 프롬프팅 기법 6종과 실전 사용 기준

kokojj 2026. 5. 31. 21:04

AI 프롬프팅 기법은 단순 작업부터 복잡한 추론까지 상황별로 골라 써야 하며, 작업 난이도와 예산에 맞춰 선택해야 비용과 정확도의 균형을 잡을 수 있습니다.

AI프롬프링기법 종류 소개
한 줄 요약
  • 결론부터 말씀드리면, 무조건 강한 기법이 정답은 아니므로 작업 난이도에 맞춰 골라 쓰는 것이 핵심입니다.
  • 단순 분류·번역은 Zero-shot으로 충분하고, 출력 형식을 맞춰야 하면 Few-shot 예제 3~5개가 가장 효율적입니다.
  • 복잡한 추론에는 Chain of Thought(산술 추론 +18%), 정확도를 끝까지 끌어올리려면 Tree of Thoughts를 쓰되 토큰 비용이 10~50배 늘어나는 점을 감안해야 합니다.

같은 모델에 같은 질문을 던져도, 입력을 어떻게 설계하느냐에 따라 답의 정확도가 크게 달라집니다. promptingguide.ai와 여러 연구가 정리한 바에 따르면, Chain-of-Thought 한 줄을 추가하는 것만으로 산술 추론 정확도가 18% 올라가기도 합니다.

그래서 프롬프팅은 단순한 글쓰기 요령이 아니라 성능을 끌어올리는 엔지니어링 기법으로 다뤄집니다. 사실 어떤 기법을 언제 쓰느냐가 비용과 정확도를 동시에 좌우합니다.

AI 프롬프팅 기법이란 정확히 뭔가요

프롬프팅 기법은 한마디로 거대언어모델(LLM — 방대한 텍스트로 학습해 다음 단어를 예측하는 AI 모델)에게 원하는 출력을 끌어내기 위한 입력 설계 방식입니다. 같은 재료라도 레시피에 따라 요리 맛이 달라지듯, 같은 모델도 프롬프트 구성에 따라 결과가 달라집니다.

왜 이게 중요할까요? 모델은 질문의 의도를 스스로 보강하지 않기 때문입니다. 예제를 보여줄지, 추론 과정을 강제할지, 여러 답을 비교할지에 따라 정확도와 비용이 함께 움직입니다. 그래서 기법 선택이 곧 성능 튜닝이 됩니다.

용어 — 프롬프팅(Prompting)
모델에게 보내는 입력(프롬프트)을 의도적으로 설계해 원하는 출력을 유도하는 작업입니다. 예제 제공·추론 단계 유도·다중 샘플 비교 등이 모두 여기에 속합니다.

각 프롬프팅 기법은 어떤 원리로 작동하나요

기법마다 모델을 다루는 방식이 다릅니다. 쉽게 말하면, 예제를 줄지·생각을 시킬지·여러 번 답하게 할지로 나뉩니다. 핵심 6종을 작동 원리 순으로 정리했습니다.

Zero-shot은 예제 없이 작업만 지시하는 방식입니다. Brown et al.(2020)에 따르면 GPT-3는 이 방식으로 CoQA 읽기 이해에서 81.5 F1을 기록했습니다. Few-shot은 입력 안에 정답 예제 몇 개를 함께 넣어 출력 형식을 학습시키는 방식인데, 예제 3~5개에서 성능이 가장 좋고 그 이상은 맥락 창만 잡아먹습니다.

Chain of Thought(CoT)는 "단계별로 생각해 보자"처럼 중간 추론 과정을 쓰게 유도합니다. Wei et al.(2022)에서 산술 추론 +18%를 보였습니다. Tree of Thoughts(ToT)는 여러 추론 갈래를 트리처럼 탐색해 best를 고르고, Self-Consistency는 같은 질문을 여러 번 풀어 다수결로 답을 정합니다.

쉽게 말하면 — 쉽게 말하면, Zero-shot은 그냥 시키기, Few-shot은 예시 보여주기, CoT는 풀이 과정 쓰게 하기, ToT는 여러 풀이를 비교하기, Self-Consistency는 여러 번 풀어 다수결로 정하기입니다.
기법 작동 원리 대표 성능 출처
Zero-shot 예제 없이 작업만 직접 지시 GPT-3 CoQA 81.5 F1 Brown et al. 2020
Few-shot 예제 3~5개 제공해 형식 학습 예제 3~5개에서 최적 Brown et al. 2020
Chain of Thought 중간 추론 단계를 쓰게 유도 산술 추론 +18% Wei et al. 2022
Zero-shot CoT "Let's think step by step" 한 줄 추가 예제 없이 CoT 효과 Kojima et al. 2022
Tree of Thoughts 여러 추론 갈래를 트리 탐색 Game of 24 74%(CoT 4%) Yao et al. 2023
Self-Consistency 여러 번 풀어 다수결로 결정 GSM8K +17.9% vs CoT Wang et al. 2022

왜 지금 기법 선택이 중요해진 건가요

강한 기법일수록 비용이 가파르게 오르기 때문입니다. Yao et al.(2023)에 따르면 Tree of Thoughts는 Game of 24 벤치마크에서 CoT의 4%를 74%까지 끌어올렸지만, 표준 프롬프팅보다 토큰을 10~50배 소비합니다. 정확도는 좋지만 그만큼 호출 비용이 폭증한다는 뜻입니다.

Self-Consistency도 마찬가지입니다. 질문 하나당 5~10개의 답을 생성해 다수결을 내야 해서 호출 수가 그만큼 늘어납니다. Few-shot 역시 예제를 과하게 넣으면 맥락 창만 차지하고 정확도 이득은 줄어듭니다.

그래서 실무에서는 작업 난이도와 예산을 함께 보고 기법을 정합니다. 단순 분류에 ToT를 쓰면 비용 낭비, 복잡한 다단계 추론에 Zero-shot만 쓰면 정확도 손해입니다. 다만 모델·작업에 따라 결과 폭이 다를 수 있으니 소규모로 먼저 비교해 보는 편이 안전합니다.

주의 — 주의 — 무조건 최신·강력 기법을 선택하면 토큰 비용이 폭증합니다. ToT는 표준 대비 10~50배, Self-Consistency는 질문당 5~10회 호출이 필요하므로 단순 작업에는 과합니다.

자주 묻는 질문

핵심 — 핵심만 다시 짚으면, 단순 작업은 Zero-shot, 형식이 필요하면 Few-shot(3~5개), 추론은 CoT, 정확도 최우선은 ToT, 일관성은 Self-Consistency입니다.

Q. Zero-shot과 Few-shot의 차이는 무엇인가요?

Zero-shot은 예제 없이 작업만 지시하는 방식이고, Few-shot은 입력 안에 정답 예제 몇 개를 함께 넣어 출력 형식을 학습시키는 방식입니다. GPT-3는 Zero-shot으로도 CoQA에서 81.5 F1을 냈지만, 출력 형식을 정확히 맞춰야 한다면 예제 3~5개를 넣는 Few-shot이 더 안정적입니다.

Q. Chain of Thought는 항상 더 좋은가요?

아닙니다. CoT는 산술·논리처럼 중간 단계가 필요한 추론에서 +18% 같은 이득을 주지만, 단순 분류나 번역처럼 추론이 거의 없는 작업에서는 토큰만 늘고 효과가 작습니다. 작업에 추론 단계가 실제로 존재할 때 쓰는 것이 합리적입니다.

Q. Tree of Thoughts는 언제 쓰나요?

정답 정확도가 비용보다 훨씬 중요한 복잡한 탐색 문제에 적합합니다. Game of 24에서 CoT 4%를 74%까지 끌어올린 것이 대표 사례입니다. 다만 표준 프롬프팅보다 토큰을 10~50배 소비하므로, 일상적인 단순 작업에는 권장하지 않습니다.

Q. Self-Consistency는 비용이 많이 드나요?

네, 호출 수가 늘어납니다. 같은 질문을 5~10개의 답으로 풀어 다수결을 내는 방식이라 그만큼 토큰과 호출 비용이 증가합니다. 대신 GSM8K에서 CoT 대비 +17.9%처럼 답의 일관성과 정확도를 높일 수 있어, 정확도가 중요한 곳에서 가치가 있습니다.

Q. Auto-CoT는 무엇인가요?

Zhang et al.(2022)이 제안한 방법으로, 사람이 추론 예제를 일일이 만들지 않고 LLM이 자동으로 시연용 추론 체인을 생성하게 합니다. 질문을 군집으로 묶는 클러스터링과 시연 샘플링 두 단계로 구성되어, CoT 예제 작성 수고를 줄여 줍니다.