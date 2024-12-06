검색 증강 생성(RAG)은 신뢰할 수 있는 지식 기반의 참조를 사용하여 대규모 언어 모델의 아웃풋을 최적화하는 아키텍처입니다. 이렇게 하면 언어 모델이 응답을 생성하기 전에 검증된 소스로 학습 데이터가 보강됩니다. LLM은 대규모 말뭉치를 학습하고 수십억 개의 매개변수를 사용하여 아웃풋을 생성하지만, 말뭉치 훈련에서 최신 정보나 정확한 정보에 접근하지 못할 수도 있습니다. RAG는 모델을 재학습할 필요 없이 LLM의 이미 강력한 능력을 특정 도메인으로 확장합니다. LLM의 아웃풋을 개선하여 다양한 상황에서 관련성, 정확성 및 유용성을 유지할 수 있는 강력하고 잠재적으로 비용 효율적인 방법입니다.

DSPy에서는 서명에 맥락 단계를 추가하여 RAG 아키텍처를 사용합니다. 이 단계에서는 검색 모델에서 맥락을 수집하고 이를 언어 모델의 프롬프트에 추가하여 더 나은 응답을 유도할 수 있습니다.

class GenerateAnswer(dspy.Signature):

“””Answer questions with short factoid answers.”””



context = dspy.InputField(desc=”may contain relevant facts”)

question = dspy.InputField()

answer = dspy.OutputField(desc=”often between 1 and 5 words”)

이 newGenerateAnswer 시그니처는 RAG 모델과 함께 사용할 수 있습니다. theGenerateAnswer를 'ChainOfThought' 모듈에 전달하여, 검색된 컨텍스트와 질문 및 답변이 생각의 연결고리 접근 방식을 사용하도록 합니다.

또한 RAG에서 맥락 구절을 생성하고 이를 사용하여 답변을 생성하기 위해 forward 메서드를 업데이트합니다. DSPy는 질문에 대한 응답으로 새 답변을 생성할 때마다 이 'forward' 메서드를 호출하여 ColBERT Wiki 17 추상 데이터 세트에서 두 컨텍스트를 모두 수집한 다음 해당 맥락을 언어 모델(이 경우 Llama)에 전달합니다. 각 답변을 생성할 때 DSPy는 아웃풋을 원하는 아웃풋과 비교하여 프롬프트가 모델이 올바른 응답을 생성하는 데 도움이 되는지 확인합니다.

class RAG(dspy.Module):

def __init__(self, num_passages=3):

super().__init__()



self.retrieve = dspy.Retrieve(k=num_passages)

self.generate_answer = dspy.ChainOfThought(GenerateAnswer)



def forward(self, question):

context = self.retrieve(question).passages

prediction = self.generate_answer(context=context, question=question)

return dspy.Prediction(context=context, answer=prediction.answer)

DSPy가 최상의 프롬프트를 엔지니어링할 수 있도록 하려면 프롬프트를 테스트하고 평가할 수 있는 데이터 세트가 필요합니다.

DSPy 테스트 질문을 제공하기 위해 HotPotQA 데이터 세트를 불러옵니다. HotpotQA는 정답에 도달하기 위해 여러 번의 검색과 추론이 필요한 자연스러운 다중 홉 질문을 특징으로 하는 질문 답변 데이터 세트입니다. 모델이 더 설명 가능한 질문 답변 시스템을 학습하고 테스트하기 위해 지원 사실을 얼마나 잘 생성하는지 테스트하는 데 유용한 도구입니다.

예를 들어 데이터 세트에는 "프랭클린 루즈벨트 대통령은 선거인단의 표를 의회에 전달할 책임자를 누구로 임명했습니까?"라는 질문이 있습니다. 이 질문에 올바르게 답하려면 몇 가지 정보가 필요하다는 것을 알 수 있습니다.

The answer is: “Robert Digges Wimberly Connor”.

이를 뒷받침하는 맥락은 로버트 디그스 윔벌리 코너와 국립 기록 보관소에 대한 위키백과 페이지에서 나옵니다.

HotPotQA는 카네기 멜론 대학교, 스탠포드 대학교 및 몬트리올 대학교의 NLP 연구원 팀에 의해 수집 및 게시됩니다. HotPotQA에 대한 자세한 내용은 GitHub 사이트에서 확인할 수 있습니다.

데이터 세트를 불러와서 학습 세트와 테스트 세트로 나눕니다. 이는 검색 체인을 테스트하고 DSPy가 언어 모델에 가장 적합한 프롬프트를 찾는 데 도움이 될 수 있습니다.

# Load the dataset.

dataset = HotPotQA(train_seed=1, train_size=20, eval_seed=2023, dev_size=50, test_size=0)



# Tell DSPy that the ‘question’ field is the input. Any other fields are labels and/or metadata.

trainset = [x.with_inputs(‘question’) for x in dataset.train]

devset = [x.with_inputs(‘question’) for x in dataset.dev]

다음으로, DSPy가 프롬프트를 생성하고 평가할 수 있는 더 많은 기회를 제공하기 위해 더 많은 예제를 부트스트랩합니다. Callingcompile는 사용자가 구성한 모든 아키텍처와 HotPotQA 데이터 세트를 사용하여 프롬프트를 생성하고 테스트하며, 언어 모델에서 최고의 성과를 끌어냅니다.

from dspy.teleprompt import BootstrapFewShot



# Validation logic: check that the predicted answer is correct.

# Also check that the retrieved context does actually contain that answer.

def validate_context_and_answer(example, pred, trace=None):

answer_EM = dspy.evaluate.answer_exact_match(example, pred)

answer_PM = dspy.evaluate.answer_passage_match(example, pred)

return answer_EM and answer_PM



# Set up a basic DSPy optimizer, which will compile your RAG program.

bfs_optimizer = BootstrapFewShot(metric=validate_context_and_answer)



# Compile!

compiled_rag = bfs_optimizer.compile(RAG(), trainset=trainset)

이제 DSPy가 프롬프트 엔지니어링을 수행했으니 이전에 사용했던 2006노벨상에 대한 사용자 지정 질문으로 이를 테스트해 보겠습니다. 검색 모델은 2017년도 Wikipedia 추출본을 사용하기 때문에 해당 말뭉치에 있을 수 있는 지식으로 최상의 성능을 발휘합니다.

# Get the prediction. This contains `pred.context` and `pred.answer`.

pred = compiled_rag(test_question)



# Print the contexts and the answer.

print(f”Question: {test_question}”)

print(f”Predicted Answer: {pred.answer}”)

이제 정답을 찾을 수 있습니다.

질문: 2006년 노벨 문학상 수상자는 어느 국가 출신이며 이름은 무엇이었나요? 예상 답변: 튀르키예, 오르한 파묵

오르한 파묵은 터키 출신이므로 이 답이 맞습니다. DSPy의 컴파일된 버전은 정답을 맞혔을 뿐만 아니라 짧고 명확한 응답으로 답장을 올바르게 구성했습니다. 이 예측된 응답의 맥락을 보면서, 모델이 어떻게 정답에 도달했는지 살펴봅시다.

pred.context

이 경우 반환:

["오르한 파묵 | 페리트 오르한 파묵(Ferit Orhan Pamuk, 오르한 파묵으로 알려짐, 1952년 6월 7일 출생)은 튀르키예의 소설가, 시나리오 작가, 학자이며 2006년에 노벨 문학상을 수상했습니다. 튀르키예에서 가장 저명한 소설가 중 한 명인 그는 63개 언어로 1,300만 권 이상의 책이 판매된 튀르키예의 베스트셀러 작가입니다.", '2006 팔랑카 어워드 | 2006년 카를로스 팔랑카 기념 문학상 수상자(순위, 수상작 제목, 저자 이름).', "미구엘 도노소 파레하 | 미구엘 도노소 파레하(Miguel Donoso Pareja, 1931년 7월 13일 – 2015년 3월 16일)는 에콰도르 작가이자 2006년 프레미오 에우제니오 에스페호 상(에콰도르 대통령이 수여하는 에콰도르 국가 문학상)을 수상했습니다."]

답은 반환된 첫 번째 맥락 청크에 있습니다. 언어 모델의 theinspect_history() 메서드를 사용하여 언어 모델의 기록을 살펴보면 DSPy가 최적의 프롬프트를 어떻게 설계했는지 확인할 수 있습니다.

lm.inspect_history()

이 기록은 DSPy가 생성된 프롬프트를 테스트한 컴파일 프로세스의 모든 예제를 포함하기 때문에 매우 깁니다. 기록의 마지막 부분은 모델이 올바른 답과 올바른 형식에 도달한 방법을 보여줍니다.

[[ ## context ## ]] [1] «오르한 파묵 | 페리트 오르한 파묵(Ferit Orhan Pamuk, 보통 오르한 파묵으로 알려짐, 1952년 6월 7일생)은 터키의 소설가, 시나리오 작가, 학자이며 2006년 노벨 문학상 수상자입니다. 튀르키예에서 가장 저명한 소설가 중 한 명입니다. 그의 작품은 63개 언어로 1,300만 권 이상 판매되었으며 그는 튀르키예의 베스트 셀러 작가입니다.» [2] «2006 팔랑카 어워드 | 2006년 카를로스 팔랑카 기념 문학상 수상자(순위, 수상작 제목, 저자 이름).» [3] «미구엘 도노소 파레하 | 미구엘 도노소 파레하(Miguel Donoso Pareja, 1931년 7월 13일 – 2015년 3월 16일)는 에콰도르 작가이자 2006년 프레미오 에우제니오 에스페호 상(에콰도르 대통령이 수여하는 에콰도르 국가 문학상)을 수상했습니다.» [[ ## question ## ]] 2006년 노벨 문학상 수상자는 어느 국가 출신이며 이름은 무엇이었습니까? '[[ ## reasoning ## ]]' 필드로 시작하여 '[[ ## answer ## ]]', '[[ ## completed ## ]]'에 대한 마커로 끝나는 아웃풋 필드로 응답합니다. [31mResponse:[0m [32m[[ ## reasoning ## ]] 본문에는 2006년 노벨 문학상이 언급되어 있으며 튀르키예 소설가 오르한 파묵이 수상자라고 명시되어 있습니다. [[ ## answer ## ]] 튀르키예, 오르한 파묵 [[ ## completed ## ]][0m

DSPy가 모델을 사용하여 프롬프트를 생성한 것을 볼 수 있습니다.

관련 아웃풋 필드로 응답합니다. [[ ## reasoning ## ]] 필드에서 시작해 [[ ## answer ## ]] 로 넘어간 다음 [[ ## completed ## ]] .

이는 정답과 프레이밍으로 이어집니다.