DSPy는 다양한 유형의 워크플로 및 시나리오에서 유용할 수 있습니다. 가장 일반적으로 사용되는 워크플로 및 시나리오 중에는 검색 증강 생성, 멀티홉 질문 답변 및 문서 요약이 있습니다.

생각의 연결고리

생각의 연결고리(CoT) 프롬프트는 모델에 복잡한 작업을 최종 해결을 향한 일련의 논리적 단계로 세분화하도록 요청하여 인간과 유사한 추론 과정을 시뮬레이션합니다. 이러한 추론 단계는 모델의 컨텍스트 창에 입력되어 당면한 작업에 더 많은 지식 기반을 제공하며, 복잡한 시나리오에서도 더 나은 답변을 제공하는 경우가 많습니다. DSPy는 언어 모델이 생각의 연결고리 프롬프트와 전략을 생성하도록 하고 이를 언어 모델로 테스트하여 주어진 모델에 대해 가장 효과적인 프롬프트를 생성하도록 하는 데 도움이 됩니다.

검색 증강 생성

검색 증강 생성(RAG)은 LLM이 출처에서 방대한 지식 말뭉치를 활용하고 지식 저장소를 쿼리하여 관련 구절이나 콘텐츠를 찾아 잘 정제된 답변을 생성할 수 있도록 하는 접근 방식입니다. RAG는 LLM이 원래 해당 주제에 대해 교육을 받지 않았더라도 실시간 지식을 동적으로 사용하고 정답을 제공할 수 있도록 보장합니다. 이러한 추가 성능으로 인해 RAG 파이프라인을 설정할 때 복잡성이 더 커집니다. DSPy는 프롬프트 파이프라인을 설정하고 효과적인 프롬프트를 생성하거나(프롬프트 튜닝) 더 작은 모델의 경우 모델 가중치 자체를 미세 조정하는 원활한 접근 방식을 제공합니다.

RAG 파이프라인은 레이블이 지정된 예시를 사용하거나 부트스트랩 예시를 사용하는 두 가지 방법으로 DSPy로 최적화할 수 있습니다. 레이블이 지정된 예시는 기존에 존재하며, 수동으로 레이블이 지정된 예시는 학생 모델을 직접 훈련하는 데 사용됩니다. DSPy 컨텍스트에서 부트스트랩은 교사와 학생 패러다임에서 언어 모드를 사용하는 것을 의미합니다. 교사는 사용자가 제공한 몇 가지 프롬프트를 기반으로 새로운 교육 예시를 생성합니다. 그런 다음 이러한 부트스트랩된 예시를 수동으로 레이블이 지정된 예시와 함께 또는 대신 사용하여 정답을 제공할 때까지 학생 모듈을 훈련합니다. 그런 다음 올바른 답변을 생성하는 프롬프트는 DSPy 파이프라인 전체에서 반복적으로 업데이트됩니다.

멀티홉 질문 답변

복잡한 질문 답변 작업에서는 단일 쿼리만으로는 충분하지 않은 경우가 많습니다. 인기 있는 HotPot 질문 답변 데이터 세트는 여러 질문 구문 분석 및 검색을 해야 답변할 수 있는 질문으로 구성됩니다. 예를 들어: "빌 넬슨은 몇 년도에 처음으로 발사된 우주왕복선에 페이로드 전문가로 탑승했습니까?" 이 질문에 답변하려면 빌 넬슨이 우주왕복선 컬럼비아호를 타고 비행했다는 것을 알고 컬럼비아호가 1981년에 처음 비행했다는 것을 확인할 수 있어야 합니다.

검색 증강 문헌에서 이 문제에 대한 표준적인 접근 방식은 멀티홉 검색 시스템을 구축하는 것입니다. 이러한 시스템은 검색된 결과를 읽은 다음 최종 답변에 도달하기 전에 필요한 경우 추가 정보를 수집하기 위해 추가 쿼리를 생성합니다. DSPy를 사용하면 단 몇 줄의 코드만으로 같은 시스템을 모델을 업데이트하고 파이프라인을 다시 실행할 수 있는 강력한 방식으로 만들 수 있습니다.

요약

요약은 핵심 정보와 주요 아이디어를 유지하면서 긴 텍스트를 더 짧은 버전으로 압축합니다. 이는 LLM이 기사 초록 작성부터 긴 문서에서 간결한 보고서를 생성하는 일에 이르기까지 다양한 응용 분야를 통해 잘할 수 있는 강력한 기술입니다.

언어 모델에서 생성된 요약의 품질을 평가하는 것은 중요한 과제를 안겨줍니다. 정답 또는 오답이 명확한 작업과 달리, 요약 품질은 주관적이고 상황에 따라 달라지는 경우가 많습니다. 모델은 원본 텍스트의 어조와 의도를 보존하면서 정보 보존과 간결성의 균형을 맞추는 동시에 오류를 일으키지 않고 사실의 정확성을 보장해야 합니다. 다양한 유형의 원본 자료 및 요약 목적에 적응해야 하는 어려움 또한 존재합니다. DSPy를 사용하면 레이블이 지정된 데이터를 사용해 프롬프트를 조정하여 최상의 답변을 얻을 수 있습니다.