ChatGPT
ChatGPT | |
---|---|
Tipo | protótipo, Inteligência artificial generativa, software privativo, IA conversacional, Modelo de linguaxe de grande escala, Chatbot e servizo en liña |
Data de fundación | 30 de novembro de 2022 |
Nomeado en referencia a | chat e GPT-1 |
Na rede | |
https://chat.openai.com/ e https://chatgpt.com/ | |
[ editar datos en Wikidata ] |
ChatGPT é un prototipo de chatbot de intelixencia artificial centrado na usabilidade e o diálogo. Desenvolvido por OpenAI, o chatbot usa un modelo de linguaxe adestrado mediante a aprendizaxe automática por reforzo e baseado na arquitectura GPT-4.[1]
Características
[editar | editar a fonte]Introducido o 30 de novembro de 2022, ChatGPT chamou a atención pola súa facilidade de uso e destacou polas súas respostas detalladas e o seu coñecemento histórico. O formato de diálogo permite a ChatGPT responder preguntas de seguimento, admitir os seus erros, desafiar premisas incorrectas e rexeitar solicitudes inadecuadas.[2] O chatbot é capaz de xerar todo tipo de textos, dende poesía ata diálogos. Non obstante, a pesar da ampla gama de sinais aos que é capaz de reaccionar, a súa imperfecta precisión fáctica recibiu algunhas críticas.
ChatGPT adestrouse mediante a aprendizaxe de reforzo a partir de adestramento supervisado, un método que aumenta a aprendizaxe automática con entradas humanas para lograr un resultado realista.[3] Está baseado na arquitectura GPT-3.[4] Durante o proceso de adestramento, os supervisores humanos desempeñaron o papel de usuarios e asistentes de IA. O modelo foi adestrado na infraestrutura de supercomputación de Microsoft Azure e axustouse mediante algoritmos de optimización de políticas próximas.[5] Os algoritmos de optimización de políticas proximais presentan un beneficio rendible ao depender de algoritmos de optimización de políticas rexionais e negan moitas das operacións computacionalmente custosas cun rendemento máis rápido.[6][7]
Comparado co seu predecesor InstructGPT, ChatGPT intenta reducir as respostas nocivas e enganosas. Os datos de adestramento de ChatGPT inclúen documentos da aplicación Man, unha ferramenta de sistemas Unix, e coñecemento de fenómenos de Internet como o sistema de taboleiros de anuncios e a linguaxe de programación Python.[8]
A diferenza da maioría dos chatbots, ChatGPT ten estado e lembra conversas anteriores coas indicacións que recibiu, o que pode permitir que ChatGPT se use como terapeuta personalizado.[9] Nun esforzo para evitar que se produzan resultados ofensivos, en ChatGPT, as consultas fíltranse a través dunha API de moderación que rexeita as referencias potencialmente racistas ou sexistas. [10] [9]
ChatGPT ten varias limitacións. O modelo de recompensa de ChatGPT, deseñado en torno á supervisión humana, pódese optimizar en exceso e, polo tanto, dificultar o rendemento, tamén coñecido como Lei de Goodhart.[11] Durante a formación, os revisores preferiron respostas máis longas, independentemente da comprensión real ou do contido real.[2] Os datos de adestramento tamén poden sufrir un nesgo algorítmico e as indicacións que inclúen descriptores vagos de persoas, como por exemplo un CEO, poderían xerar unha resposta que asuma que esa persoa é un varón branco.[12]
Limitacións
[editar | editar a fonte]A pesar da súa capacidade de comprensión e rapidez para responder preguntas e xerar textos, o chatbot ten certas limitacións e o seu software pode ter problemas para procesar a información dada se é demasiado complexa. Por outra banda, tampouco é capaz de tratar con toda precisión e detalle conceptos ou acontecementos demasiado recentes, xa que a inxesta de coñecemento detívose no 2021. Ademais, ChatGPT está deseñado para non permitir preguntas inadecuadas nin solicitudes perigosas. [13]
Preocupacións éticas
[editar | editar a fonte]A relación entre a intelixencia artificial e a ética é un tema que está de actualidade e provoca certas preocupacións. As empresas tecnolóxicas que ofrecen programas como este son conscientes de certos límites que non se poden traspasar.
No caso de ChatGPT, o sistema pode recoller prexuízos e opinións xerais de Internet de forma que en ocasións, dependendo da solicitude do usuario, chegue a crear bromas ou vaia guiarse por estereotipos sobre determinados personaxes. Así mesmo, tamén ten acceso a noticias falsas e teorías de conspiración que poden interferir con que os datos proporcionados polo chatbot non sexan totalmente veraces. Unha das outras restricións programadas por OpenAI son avisos a preguntas concretas: se se lle pregunta como intimidar a alguén responderá que o acoso é malo, así como se se lle pregunta sobre manipular persoas ou construír armas perigosas.[13]
Notas
[editar | editar a fonte]- ↑ "ChatGPT FAQ". help.openai.com (en inglés). Consultado o 16/01/2023.
- ↑ 2,0 2,1 OpenAI (30/11/2022). "ChatGPT: Optimizing Language Models for Dialogue" (en inglés). Consultado o 16/01/2023.
- ↑ Knox, W. Bradley; Stone, Peter. "Augmenting Reinforcement Learning with Human Feedback" (PDF) (en inglés). Consultado o 16/01/2023.
- ↑ Ahmed, Zohaib (2/12/2022). "What is ChatGPT, the AI chatbot everyone’s talking about". The Indian Express (en inglés). Consultado o 16/01/2023.
- ↑ "ChatGPT: Optimizing Language Models for Dialogue" (en inglés). 30/11/2022. Consultado o 16/01/2023.
- ↑ Gao, Leo; Schulman, John; Hilton, Jacob (19/10/2022). "Scaling Laws for Reward Model Overoptimization" (PDF). Cornell University (en inglés). Consultado o 16/01/2023.
- ↑ Wouter, van Heeswijk (29/11/2022). "Proximal Policy Optimization (PPO) Explained". Towards Data Science (en inglés). Consultado o 16/01/2023.
- ↑ Edwards, Benj (5/12/2022). "No Linux? No problem. Just get AI to hallucinate it for you". Ars Technica (en inglés). Consultado o 16/01/2023.
- ↑ 9,0 9,1 Roose, Kevin (5/12/2022). "The Brilliance and Weirdness of ChatGPT". The New York Times (en inglés). Consultado o 16/01/2023.
- ↑ ChatGPT OpenAI (30/11/2022). "Optimizing Language Models for Dialogue" (en inglés). Consultado o 16/01/2023.
- ↑ Gao, Leo; Schulman, John; Hilton, Jacob (19/10/2022). "Scaling Laws for Reward Model Overoptimization" (PDF). arXiv:2210.10760 [cs, stat] (en inglés). Consultado o 16/01/2023.
- ↑ Kelly, Samantha Murphy (5/12/2022). "This AI chatbot is dominating social media with its frighteningly good essays". CNN Business (en inglés). Consultado o 16/01/2023.
- ↑ 13,0 13,1 BBC Science Focus Magazine, ed. (8/12/2022). "ChatGPT: Everything you need to know about OpenAI's GPT-3 tool". Science Focus (en inglés). Consultado o 16/01/2023.
Véxase tamén
[editar | editar a fonte]Wikimedia Commons ten máis contidos multimedia na categoría: ChatGPT |