Cómo crear bots conversacionales

myBotEstoy trabajando en un proyecto personal para acercar la inteligencia artificial a todo el mundo. Se trata de un editor de bots conversacionales. El proyecto se llama myBot, y podéis probarlo aquí.

También os había prometido detalles técnicos. A continuación os cuento un poco cómo funciona. El motor de todo el sistema es una red de neuronas recurrente. Más específicamente, una red con neuronas (o células) LSTM. La principal ventaja de este tipo de redes es que poseen memoria. Son capaces de recordar información que recibieron en su entrada anteriormente. Por eso mismo, se utilizan con frecuencia para reconocer secuencias de datos.

Si recordáis el artículo sobre Deep Learning, las redes de neuronas convencionales (feed forward) se entrenan con ejemplos que son pares [entrada, salida], de forma que si a la red le presentamos esa entrada, nos gustaría que produjese la salida que le hemos enseñado. Si recordáis, lo primero que tenemos que decidir, es cómo codificar entrada y salida como listas fijas de números. ¿Pero qué sucede si intentamos aplicar este modelo a secuencias de datos, como por ejemplo las secuencias de caracteres en frases o párrafos? Pues que hay que empezar a usar hacks, para adaptar secuencias de longitud variable a una red con longitudes fijas.

Aquí es donde entran las redes recurrentes. Dado que son capaces de recordar las entradas anteriores, no es necesario hacer ningún hack. En el ejemplo de las frases (que es lo que se hace en myBot), damos a la red un caracter a la entrada, y luego otro, y luego otro, y así sucesivamente. Cada vez que la red recibe una entrada, producirá una salida, con lo cual, la salida también es una secuencia!

¿Y cómo entrenamos una red así? Pues ahora, los ejemplos de entrada y salida no son dos vectores con números, sino dos secuencias de vectores (posiblemente de distinta longitud). Uno de los algoritmos más utilizados para entrenar este tipo de redes se llama Propagación hacia atrás a través del tiempo (BPTT). No os voy a aburrir con los detalles, pero si os interesa más información que lo que sale en la página de Wikipedia, dejadme un mensaje y os contesto con más referencias.

¿Qué podemos hacer con una red como esta? Prácticamente cualquier cosa que tenga que ver con secuencias. Por ejemplo, asociar preguntas con respuestas, de forma que dada una pregunta, la red produzca una respuesta. Estaréis pensando, ¡seguro que eso es lo que hace myBot! Pues no exactamente, en myBot se utiliza la red recurrente sólo con el objetivo de clasificar las preguntas según el grupo al que pertenecen. A continuación se proporciona una de las respuestas definidas por el usuario. De esta forma, no hay sorpresas cuando la red genera gramáticas divertidas, o palabras que no existen.

Alguien se preguntará, si simplemente se reconocen preguntas y se elige una respuesta, ¿qué valor proporcionan las  redes de neuronas recurrentes? El valor que proporcionan es que modelan el lenguaje y son capaces de reconocer incluso preguntas que nadie les ha enseñado, y son muy resistentes a errores tipográficos. Esto lógicamente funciona mucho mejor cuantas más preguntas y variaciones se le enseñen al bot. Como todas las redes de neuronas, son una herramienta estadística. Cuanta más información consumen, más habilidad tienen para reconocer patrones y encontrar la información que es realmente importante.

El mundo de las redes de neuronas recurrentes es algo más enrevesado que las redes convencionales, pero si hay suficiente interés, puedo escribir un artículo de divulgación más detallado explicando cómo funcionan y cómo se entrenan. ¡Ya me contaréis!

Mientras tanto, probad mybot.be y compartid vuestras creaciones, tengo curiosidad por ver lo que sois capaces de hacer con la herramienta 🙂

Anuncios
Publicado en Uncategorized | 4 comentarios

Learning to design video games

Almost 6 years ago, I published my first video game: Egg Savior. I thought it was a great opportunity to learn what it takes to publish a game, and I was right. I did learn a lot, specially a lot about production. I also tried to get some visibility which introduced me to the super hard world of marketing and advertising. I even had a partner for the distribution in South Korea which ended up being quite successful.

Game design is hard

egg_savior_shotI also learned that designing a video game is hard. When I created the first 10 levels, I carefully sorted them by difficulty, from the easiest one to the hardest ones. Then, I did some play testing with the help of a few friends of mine. I asked them to tell me how much time and objects they ended up needing to complete each level, as well as how many attempts. The results were shocking.  Seguir leyendo

Publicado en English | Etiquetado , , | Deja un comentario

Q-learning: Aprendizaje automático por refuerzo

“Tekno the Robotic Puppy” by Toyloverz – Own work. Licensed under CC BY-SA 3.0 via Wikimedia Commons

Últimamente se ha dado bastante bombo a la investigación realizada por la empresa Deep Mind donde consiguen que un programa aprenda a jugar a juegos clásicos de Atari. El artículo original es del 2013, pero por alguna razón la prensa se ha vuelto loca hablando del tema en 2015. El artículo de Deep Mind combina el reciente interés en deep learning con el clásico algoritmo de aprendizaje por refuerzo q-learning, inventado hace más de 25 años. Seguir leyendo

Publicado en Español, ingeniería | Etiquetado , , , , , , , , , | 5 comentarios

Nothing to fix here, move along

keep calmOnce again, I got one of those bugs that can be quickly resolved. The bug description matches precisely what the team meant when we wrote that piece of code. We did that on purpose, and there is a resolution for that in your favorite bug tracker: WONTFIX. It will only take a few seconds of my time, and my bug count will go down. Seguir leyendo

Publicado en engineering, English | Etiquetado , , | 3 comentarios

¿Qué es y cómo funciona “Deep Learning”?

Deep Learning es el término de moda últimamente. Parece que cualquier avance importante en aprendizaje automático se apoya en el famoso término. En el momento de escribir este artículo, no hay a penas recursos en español, por eso he decidido escribirlo en ese idioma. Con el objetivo de que sea lo más ameno posible, voy a evitar las fórmulas matemáticas. Encontrarás enlaces a artículos en inglés con las fórmulas en caso de que las necesites.

Seguir leyendo

Publicado en Español, ingeniería | Etiquetado , , , , , , , , | 52 comentarios

Automation

As an engineer, it is my job and my passion to create and improve technology.

Ever since we started transforming simple rocks into knives and hammers, technology has deeply affected society. We can do things that seemed impossible for humans, like flying, and visiting other worlds. But also, technology has allowed us to do essentially the same things as before, just faster and using less resources, like traveling and feeding. We can even do the same things as before but using many more resources, like with plastic cutlery, but that’s another story.

Seguir leyendo

Publicado en engineering, English | Etiquetado , , , | 2 comentarios

Egg Savior 2.3

I am proud to announce the latest version of my android game. It has been more than three years since I started this journey, and I am still learning when I find some time to spend improving it.

Egg Savior Seguir leyendo

Publicado en English | Etiquetado , , , | Deja un comentario