Pular para o conteúdo principal

OpenAI::Completions - Scraper OpenAI Completions

img

Visão geral do scraper

Visão geral do scraper: configuração

Scraper OpenAI Completions. Scraper do método Completions da OpenAI. Criado com base na API oficial e utiliza uma chave de API. Semelhante ao scraper OpenAI::ChatGPTOpenAI::ChatGPT, a principal diferença é a ausência da opção System prompt content e outros tipos de modelos para geração.

A funcionalidade do A-Parser permite salvar as configurações de extração de dados deste scraper para uso futuro (modelos), definir cronogramas de extração de dados e muito mais. Você pode usar a multiplicação automática de consultas, substituição de subconsultas a partir de arquivos, combinação de caracteres alfanuméricos e listas para obter a maior quantidade possível de resultados.

A gravação dos resultados é possível no formato e estrutura que você necessita, graças ao poderoso motor de modelos integrado Template Toolkit, que permite aplicar lógica adicional aos resultados e exibir dados em vários formatos, incluindo JSON, SQL e CSV.

Dados coletados

  • Resposta da OpenAI
  • Quantidade de tokens utilizados

Recursos

  • Extrair dados da resposta da OpenAI

Casos de uso

  • Geração de respostas da OpenAI para quaisquer perguntas

Consultas

Como consultas, é necessário indicar o texto em uma linha, por exemplo:

What are 5 key points I should know when studying Ancient Rome?

Substituições de consultas

Você pode usar macros integrados para a multiplicação de consultas.

No formato de consultas, indicaremos a alternância de caracteres de a até zzzz, este método permite rotacionar ao máximo os resultados de busca e obter muitos novos resultados únicos:

$query {az:a:zzzz}

Este macro criará 475254 consultas adicionais para cada consulta de busca inicial, o que resultará em um total de 4 x 475254 = 1901016 consultas de busca, um número impressionante, mas isso não é problema para o A-Parser. Com uma velocidade de 2000 consultas por minuto, tal tarefa será processada em apenas 16 horas.

Exemplos de saída de resultados

O A-Parser suporta formatação flexível de resultados graças ao motor de modelos integrado Template Toolkit, o que permite exibir resultados em formato livre, bem como estruturado, por exemplo, CSV ou JSON

Saída padrão

Formato do resultado:

Used tokens: $total_tokens, Answer:\n$answer\n

Exemplo de resultado:

Used tokens: 290, Answer:
1. Founding and Early History: Ancient Rome was founded in 753 BCE by twin brothers Romulus and Remus. The city grew to become one of the most powerful and influential empires in world history.
2. Roman Republic: The Roman Republic was established in 509 BCE and lasted until 27 BCE. During this time, Rome developed a complex system of government, with two consuls elected annually, a senate, and assemblies of citizens.
3. Roman Empire: The Roman Empire began in 27 BCE when Augustus became the first Roman emperor. The empire grew to include much of Europe, the Middle East, and North Africa and lasted until the fall of the Western Roman Empire in 476 CE.
4. Achievements and Contributions: Ancient Rome made significant contributions to architecture, engineering, law, philosophy, art, literature, and language. Roman innovations include the arch, concrete, aqueducts, roads, and the Latin alphabet.
5. Decline and Fall: The Roman Empire faced numerous challenges, including economic instability, political corruption, military defeats, and invasions by barbarian tribes. The Western Roman Empire fell in 476 CE, while the Eastern Roman Empire (Byzantine Empire) survived until 1453 CE.

Configurações possíveis

ParâmetroValor padrãoDescrição
API domainapi.openai.comPossibilidade de alterar o domínio para consultas de API
API keyChave de API. Pode-se indicar várias (uma por linha), para cada tentativa a chave será escolhida aleatoriamente entre as disponíveis e não utilizadas no âmbito da consulta atual.
Model nametext-davinci-003Tipo de modelo (gpt-3.5-turbo-instruct / babbage-002 / davinci-002 / text-davinci-003)
Temperature0.7Temperature
Top P1Top P
Maximum length256Quantidade máxima de tokens utilizados
Presence penalty0Presence penalty
Frequency penalty0Frequency penalty