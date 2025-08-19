os는 운영 체제와 함께 작동하는 데 도움이 됩니다.

io를 사용하면 데이터 스트림으로 작업할 수 있습니다.

GetPass는 API 키와 같은 민감한 정보를 캡처하는 안전한 방법을 사용하며 화면에 입력을 표시하지 않습니다.

PyPDF2.PdfReader를 사용하면 PDF에서 콘텐츠를 추출할 수 있습니다.

langchain_ibm.WatsonxLLM을 사용하면 LangChain 프레임워크 내에서 IBM Watsonx Granite LLM을 쉽게 사용할 수 있습니다.

langchain.embeddings.HuggingFaceEmbeddings는 HuggingFace 모델을 가져와 의미 검색에 중요한 텍스트 임베딩을 생성합니다.

langchain.vectorstores.FAISS는 벡터 인덱스를 구축하고 쿼리할 수 있는 효율적인 벡터 스토리지 및 유사성 검색을 위한 라이브러리입니다.

Langchain.text_Splitter.RecursiveCharacterTextSplitter는 큰 텍스트 구성 요소를 메모리에 맞지 않는 문서를 처리하는 데 필요한 작은 청크로 분할하는 데 도움이 됩니다.

langchain.schema.Document는 연결된 메타데이터가 있는 임의의 텍스트 단위를 나타내므로 langchain의 빌딩 블록이 됩니다.

requests는 API 외부에 HTTP 요청을 하는 데 사용됩니다.

botocore.client.Config는 AWS/IBM Cloud Object Storage 클라이언트에 대한 구성 설정을 정의하는 데 사용되는 구성 클래스입니다.

ibm_boto3는 클라우드 객체 스토리지와 상호 작용하는 데 도움이 되는 Python용 IBM Cloud Object Storage SDK입니다.

langchain.prompts.PromptTemplate는 언어 모델에 대한 재사용 가능한 프롬프트를 만드는 방법을 제공합니다.

langchain.tools.BaseTool은 LangChain 에이전트에 사용할 수 있는 사용자 지정 도구를 빌드하는 기본 클래스입니다.

이 단계에서는 텍스트를 처리하고, 임베딩을 생성하고, 임베딩을 벡터 데이터베이스에 저장하고, IBM의 watsonx LLM과 상호 작용하는 데 필요한 모든 도구와 모듈을 설정합니다. 다양한 데이터 유형을 소싱, 쿼리 및 검색할 수 있는 실제 RAG 시스템을 만드는 데 필요한 모든 부분을 설정합니다.