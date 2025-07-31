Em seguida, você instalará as dependências no tempo de execução. Primeiro, o llama-factory para gerar os adaptadores de classificação baixa e, em seguida, o Pandas para formatar o conjunto de dados no formato Alpaca.

!pip install -q llamafactory 2>/dev/null # pandas needed to format the dataset !pip install -q --upgrade pandas 2>/dev/null

Verifique o ambiente da GPU

Em seguida, você vai garantir que seu ambiente watsonx tenha fornecido uma GPU compatível com Torch que será necessária para usar o LLaMa-Factory.

import torch try: assert torch.cuda.is_available() is True except AssertionError: print("No GPU found, please set up a GPU before using LLaMA Factory.")

Se o fragmento de código anterior não mostrar "Nenhuma GPU encontrada", então você você está pronto para começar.

Em seguida, você importará bibliotecas para manipular dados e criar o arquivo de configuração do LLaMa Factory usado para treinamento.

# Import libraries import pandas as pd import json import yaml

Fazer download e processar o conjunto de dados MedReason

Neste tutorial, você usará uma parte do conjunto de dados MedReason O MedReason é um conjunto de dados de raciocínio médico de alta qualidade em grande escala projetado para auxiliar na resolução explicável de problemas médicos em LLMs. Enquanto o MedReason se concentra no raciocínio de um modelo e na validação das cadeias de pensamento que um modelo usa, neste caso também é útil fornecer um conjunto de dados que seja muito recente para ser incluído nos dados de treinamento do IBM Granite 3.3.

O Granite 3.3 foi projetado para aprender por meio de ajustes finos, que serão executados com o LLaMa Factory. Os modelos Granite podem ser ajustados finamente com eficiência, mesmo com recursos computacionais limitados.

Você carregará uma seleção do conjunto de dados MedReason do GitHub:

from datasets import load_dataset training = pd.read_json("https://raw.githubusercontent.com/UCSC-VLAA/MedReason/refs/heads/main/eval_data/medbullets_op4.jsonl", lines=True)

A LLaMa Factory requer que o conjunto de dados seja pré-formatado nos formatos Alpaca ou ShareGPT. Assim, formatamos de novo os campos de pergunta e resposta do conjunto de dados legal original para conter campos de instrução, entrada e saída de acordo com o formato Alpaca.

Alpaca é um formato JSON para representar instruções, entrada de usuário e saída do sistema da seguinte forma:

{ "instruction": "user instruction (required)", "input": "user input (optional)", "output": "model response (required)", "system": "system prompt (optional)", }

Como o MedReason não está formatado no Alpaca, você criará um conjunto de dados do Alpaca na próxima célula:

!mkdir -p data # Format Med Dataset to Alpaca Format formatted_data = [ { "instruction": row["question"] + str(row["options"]), "input": "", "output": row["answer"] } for _, row in training.iterrows() ] # output formatted MedReason dataset with open("data/med.json", "w", encoding="utf-8") as f: json.dump(formatted_data, f, indent=2, ensure_ascii=False)

o Llama Factory usa uma pasta específica para entender como carregar conjuntos de dados para treinamento. Este arquivo deve existir no caminho "data/dataset_info.json". Assim, devemos criar um arquivo "dataset_info.json" que inclui o caminho para o novo conjunto de dados médicos formatado que criamos para a CLI do Llama Factory para acessar o conjunto de dados. Para detalhes sobre o arquivo "dataset_info.json" consulte a documentação. No repositório do Llama Factory, há conjuntos de dados disponíveis para uso, no entanto, como estamos usando nosso próprio conjunto de dados personalizado, devemos adicionar nosso conjunto de dados ao arquivo JSON.

# "med" will be the identifier for the dataset # which points to the local file that contains the dataset dataset_info = { "med": { "file_name": "med.json", } } # Create dataset_info.json with legal dataset so can reference with llama factory with open("data/dataset_info.json", "w", encoding="utf-8") as f: json.dump(dataset_info, f, indent=2, ensure_ascii=False)

Agora que o objeto JSON formatado em Alpaca foi salvo no ambiente, você já está pronto para começar o treinamento.