ChatGPT

ChatGPT
Tipo	protótipo, Inteligência artificial generativa, software privativo, IA conversacional, Modelo de linguaxe de grande escala, Chatbot e servizo en liña
Data de fundación	30 de novembro de 2022
Nomeado en referencia a	chat e GPT-1
Na rede
	https://chat.openai.com/ e https://chatgpt.com/
	[ editar datos en Wikidata ]

ChatGPT é un prototipo de chatbot de intelixencia artificial centrado na usabilidade e o diálogo. Desenvolvido por OpenAI, o chatbot usa un modelo de linguaxe adestrado mediante a aprendizaxe automática por reforzo e baseado na arquitectura GPT-4.^[1]

Características

Introducido o 30 de novembro de 2022, ChatGPT chamou a atención pola súa facilidade de uso e destacou polas súas respostas detalladas e o seu coñecemento histórico. O formato de diálogo permite a ChatGPT responder preguntas de seguimento, admitir os seus erros, desafiar premisas incorrectas e rexeitar solicitudes inadecuadas.^[2] O chatbot é capaz de xerar todo tipo de textos, dende poesía ata diálogos. Non obstante, a pesar da ampla gama de sinais aos que é capaz de reaccionar, a súa imperfecta precisión fáctica recibiu algunhas críticas.

ChatGPT adestrouse mediante a aprendizaxe de reforzo a partir de adestramento supervisado, un método que aumenta a aprendizaxe automática con entradas humanas para lograr un resultado realista.^[3] Está baseado na arquitectura GPT-3.^[4] Durante o proceso de adestramento, os supervisores humanos desempeñaron o papel de usuarios e asistentes de IA. O modelo foi adestrado na infraestrutura de supercomputación de Microsoft Azure e axustouse mediante algoritmos de optimización de políticas próximas.^[5] Os algoritmos de optimización de políticas proximais presentan un beneficio rendible ao depender de algoritmos de optimización de políticas rexionais e negan moitas das operacións computacionalmente custosas cun rendemento máis rápido.^[6]^[7]

Comparado co seu predecesor InstructGPT, ChatGPT intenta reducir as respostas nocivas e enganosas. Os datos de adestramento de ChatGPT inclúen documentos da aplicación Man, unha ferramenta de sistemas Unix, e coñecemento de fenómenos de Internet como o sistema de taboleiros de anuncios e a linguaxe de programación Python.^[8]

A diferenza da maioría dos chatbots, ChatGPT ten estado e lembra conversas anteriores coas indicacións que recibiu, o que pode permitir que ChatGPT se use como terapeuta personalizado.^[9] Nun esforzo para evitar que se produzan resultados ofensivos, en ChatGPT, as consultas fíltranse a través dunha API de moderación que rexeita as referencias potencialmente racistas ou sexistas. ^[10] ^[9]

ChatGPT ten varias limitacións. O modelo de recompensa de ChatGPT, deseñado en torno á supervisión humana, pódese optimizar en exceso e, polo tanto, dificultar o rendemento, tamén coñecido como Lei de Goodhart.^[11] Durante a formación, os revisores preferiron respostas máis longas, independentemente da comprensión real ou do contido real.^[2] Os datos de adestramento tamén poden sufrir un nesgo algorítmico e as indicacións que inclúen descriptores vagos de persoas, como por exemplo un CEO, poderían xerar unha resposta que asuma que esa persoa é un varón branco.^[12]

Limitacións

A pesar da súa capacidade de comprensión e rapidez para responder preguntas e xerar textos, o chatbot ten certas limitacións e o seu software pode ter problemas para procesar a información dada se é demasiado complexa. Por outra banda, tampouco é capaz de tratar con toda precisión e detalle conceptos ou acontecementos demasiado recentes, xa que a inxesta de coñecemento detívose no 2021. Ademais, ChatGPT está deseñado para non permitir preguntas inadecuadas nin solicitudes perigosas. ^[13]

Preocupacións éticas

A relación entre a intelixencia artificial e a ética é un tema que está de actualidade e provoca certas preocupacións. As empresas tecnolóxicas que ofrecen programas como este son conscientes de certos límites que non se poden traspasar.

No caso de ChatGPT, o sistema pode recoller prexuízos e opinións xerais de Internet de forma que en ocasións, dependendo da solicitude do usuario, chegue a crear bromas ou vaia guiarse por estereotipos sobre determinados personaxes. Así mesmo, tamén ten acceso a noticias falsas e teorías de conspiración que poden interferir con que os datos proporcionados polo chatbot non sexan totalmente veraces. Unha das outras restricións programadas por OpenAI son avisos a preguntas concretas: se se lle pregunta como intimidar a alguén responderá que o acoso é malo, así como se se lle pregunta sobre manipular persoas ou construír armas perigosas.^[13]

Notas

↑ "ChatGPT FAQ". help.openai.com (en inglés). Consultado o 16/01/2023.
↑ ^2,0 ^2,1 OpenAI (30/11/2022). "ChatGPT: Optimizing Language Models for Dialogue" (en inglés). Consultado o 16/01/2023.
↑ Knox, W. Bradley; Stone, Peter. "Augmenting Reinforcement Learning with Human Feedback" (PDF) (en inglés). Consultado o 16/01/2023.
↑ Ahmed, Zohaib (2/12/2022). "What is ChatGPT, the AI chatbot everyone’s talking about". The Indian Express (en inglés). Consultado o 16/01/2023.
↑ "ChatGPT: Optimizing Language Models for Dialogue" (en inglés). 30/11/2022. Consultado o 16/01/2023.
↑ Gao, Leo; Schulman, John; Hilton, Jacob (19/10/2022). "Scaling Laws for Reward Model Overoptimization" (PDF). Cornell University (en inglés). Consultado o 16/01/2023.
↑ Wouter, van Heeswijk (29/11/2022). "Proximal Policy Optimization (PPO) Explained". Towards Data Science (en inglés). Consultado o 16/01/2023.
↑ Edwards, Benj (5/12/2022). "No Linux? No problem. Just get AI to hallucinate it for you". Ars Technica (en inglés). Consultado o 16/01/2023.
↑ ^9,0 ^9,1 Roose, Kevin (5/12/2022). "The Brilliance and Weirdness of ChatGPT". The New York Times (en inglés). Consultado o 16/01/2023.
↑ ChatGPT OpenAI (30/11/2022). "Optimizing Language Models for Dialogue" (en inglés). Consultado o 16/01/2023.
↑ Gao, Leo; Schulman, John; Hilton, Jacob (19/10/2022). "Scaling Laws for Reward Model Overoptimization" (PDF). arXiv:2210.10760 [cs, stat] (en inglés). Consultado o 16/01/2023.
↑ Kelly, Samantha Murphy (5/12/2022). "This AI chatbot is dominating social media with its frighteningly good essays". CNN Business (en inglés). Consultado o 16/01/2023.
↑ ^13,0 ^13,1 BBC Science Focus Magazine, ed. (8/12/2022). "ChatGPT: Everything you need to know about OpenAI's GPT-3 tool". Science Focus (en inglés). Consultado o 16/01/2023.

Véxase tamén

[1] "ChatGPT FAQ". help.openai.com (en inglés). Consultado o 16/01/2023.

[:0-2] 2,0 ^2,1 OpenAI (30/11/2022). "ChatGPT: Optimizing Language Models for Dialogue" (en inglés). Consultado o 16/01/2023.

[3] Knox, W. Bradley; Stone, Peter. "Augmenting Reinforcement Learning with Human Feedback" (PDF) (en inglés). Consultado o 16/01/2023.

[4] Ahmed, Zohaib (2/12/2022). "What is ChatGPT, the AI chatbot everyone’s talking about". The Indian Express (en inglés). Consultado o 16/01/2023.

[5] "ChatGPT: Optimizing Language Models for Dialogue" (en inglés). 30/11/2022. Consultado o 16/01/2023.

[6] Gao, Leo; Schulman, John; Hilton, Jacob (19/10/2022). "Scaling Laws for Reward Model Overoptimization" (PDF). Cornell University (en inglés). Consultado o 16/01/2023.

[7] Wouter, van Heeswijk (29/11/2022). "Proximal Policy Optimization (PPO) Explained". Towards Data Science (en inglés). Consultado o 16/01/2023.

[8] Edwards, Benj (5/12/2022). "No Linux? No problem. Just get AI to hallucinate it for you". Ars Technica (en inglés). Consultado o 16/01/2023.

[NYTimesInfo-9] 9,0 ^9,1 Roose, Kevin (5/12/2022). "The Brilliance and Weirdness of ChatGPT". The New York Times (en inglés). Consultado o 16/01/2023.

[OpenAIInfo3-10] ChatGPT OpenAI (30/11/2022). "Optimizing Language Models for Dialogue" (en inglés). Consultado o 16/01/2023.

[11] Gao, Leo; Schulman, John; Hilton, Jacob (19/10/2022). "Scaling Laws for Reward Model Overoptimization" (PDF). arXiv:2210.10760 [cs, stat] (en inglés). Consultado o 16/01/2023.

[12] Kelly, Samantha Murphy (5/12/2022). "This AI chatbot is dominating social media with its frighteningly good essays". CNN Business (en inglés). Consultado o 16/01/2023.

[:1-13] 13,0 ^13,1 BBC Science Focus Magazine, ed. (8/12/2022). "ChatGPT: Everything you need to know about OpenAI's GPT-3 tool". Science Focus (en inglés). Consultado o 16/01/2023.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]