Transformación del Q-Learning para el Aprendizaje en Agentes JADE
DOI:
https://doi.org/10.21501/21454086.1517Palabras clave:
Agentes, Aprendizaje Reforzado, JADE Patrones de implementaciónResumen
El aumento de la interacción entre los sistemas informáticos ha modificado la forma tradicional de analizarlos y desarrollarlos. La necesidad de la interacción entre los componentes del sistema es cada vez más importante para poder resolver tareas conjuntas, que de forma individual serían muy costosas o incluso imposibles de desarrollar. Los sistemas multi-agente ofrecen una arquitectura interesante y completa para ejecutar tareas distribuidas que cooperan entre sí. La creación de un sistema multi-agente o un agente requiere de gran esfuerzo por lo que se han adoptado métodos como los patrones de implementación. El patrón Proactive Obsever_JADE permite crear los agentes e incluirle en cada uno comportamientos dotados de inteligencia que pueden evolucionar utilizando técnicas de aprendizaje automático. El aprendizaje por refuerzo es una técnica del aprendizaje automático que permite a los agentes aprender a través de interacciones de prueba y error, en un ambiente dinámico. El aprendizaje por refuerzo en sistemas multi-agente ofrece nuevos retos derivados de la distribución del aprendizaje, como pueden ser la necesidad de la coordinación entre agentes o la distribución del conocimiento, que deben ser analizados y tratados.Descargas
Referencias
M. Wooldridge. “An Introduction to MultiAgent Systems”. 2nd. 2009, John Wiley & Sons. ISBN: 9780470519460.
FIPA, FIPA Agent Management Specification, 2003, Foundation for Intelligent Physical Agents. URL: http://www.fipa.org/specs/fipa00023/
FIPA, FIPA Communicative Act Library Specification, 2003, FOUNDATION FOR INTELLIGENT PHYSICAL AGENTS. URL: http://www.fipa.org/specs/fipa00037/SC00037J.html
J. Ferber. “Multi-agent systems: an introduction to distributed artificial intelligence”. 1999, Addison-Wesley. ISBN 0-201-36048-9
F. L. Bellifemine, G. Caire & D. Greenwood. “Developing Multi-Agent Systems with JADE”. 1st. 2007, Chichester: John Wiley & Sons, Ltd. ISBN: 978-0-470-05747-6. URL: http://www.wiley.com/WileyCDA/WileyTitle/productCd-0470057475.html
F. Bellifemine, F. Bergenti, G. Caire & A. Poggi, “Jade-A Java Agent Development Framework”, in Multi-Agent Programming, R. Bordini, et al. (Ed.). 2005, Springer US. pp. 125-147. URL: http://link.springer.com/chapter/10.1007%2F0-387-26350-0_5
M. Moreno, A. Carrasco, A. Rosete & M. D. Delgado. “Patrones de Implementación para Incluir Comportamientos Proactivos”. Polibits, Vol. January-June 2013, No. 47, pp. 73-87, 2013.
B. Henderson-Sellers, “From Object-Oriented to Agent-Oriented Software Engineering Methodologies”, in Software Engineering for Multi-Agent Systems III, R. Choren, et al. (Ed.). 2005, Springer Berlin Heidelberg. pp. 1-18. URL: http://link.springer.com/chapter/10.1007%2F978-3-540-31846-0_1
DARPA Envisions the Future of Machine Learning, 2013. URL: http://www.darpa.mil/news-events/2013-03-19a
T. Ishida, L. Gasser & M. Yokoo. “Organization self-design of distributed production systems”. IEEE Transactions on Knowledge and Data Engineering, Vol. 4, No. 2, pp. 123-134, 1992. DOI: 10.1109/69.134249
OMG, Agent Platform Special Interest Group: Agent Technology – Green Paper, 2000. URL: http://www.objs.com/agent/agents_Green_Paper_v100.doc
S. Franklin &A. Graesser, “Is It an agent, or just a program?: A taxonomy for autonomous agents”, in Intelligent Agents III Agent Theories, Architectures, and Languages, J. Müller, M. Wooldridge, and N. Jennings (Ed.). 1997, Springer Berlin Heidelberg. pp. 21-35. URL: http://link.springer.com/chapter/10.1007%2FBFb0013570
S. Russell &P. Norvig. “Artificial Intelligence: A Modern Approach”. 3rd, illustrated. 2010, Prentice Hall. ISBN: 978-0136042594
J. M. Crant. “Proactive Behavior in Organizations”. Journal of Management, Vol. 26, No. 3, pp. 435-462, 2000. DOI: 10.1177/014920630002600304
A. M. Grant &S. J. Ashford. “The dynamics of proactivity at work”. Research in Organizational Behavior, Vol. 28, No. -, pp. 3-34, 2008. DOI:10.1016/j.riob.2008.04.002
S. K. Parker, U. K. Bindl & K. Strauss. “Making Things Happen: A Model of Proactive Motivation”. Journal of Management, Vol. 36, No. 4, pp. 827-856, 2010. DOI: 10.1177/0149206310363732
F. Bellifemine, A. Poggi & G. Rimassa, JADE – A FIPA-compliant agent framework, 1999. URL: http://sharon.cselt.it/projects/jade/papers/PAAM.pdf
E. Gamma, R. Helm, R. Johnson & J. Vlissides. “Design Patterns: Elements of Reusable Object-oriented Software”. 2004, Pearson Education. ISBN: 978-0201634983
FIPA, FIPA Subscribe Interaction Protocol Specification, 2003, FOUNDATION FOR INTELLIGENT PHYSICAL AGENTS. URL: http://www.fipa.org/specs/fipa00095/PC00095A.pdf
R. Barr &C. Rovee-Collier. “Encyclopedia of the Sciences of Learning”. 2012, Estados Unidos: Springer. URL: http://www.springer.com/us/book/9781441914279
P. Domingos. “A few useful things to know about machine learning”. Commun. ACM, Vol. 55, No. 10, pp. 78-87, 2012. DOI: 10.1145/2347736.2347755
A. Shhab, G. Guo & D. Neagu, A Study on Applications of Machine Learning Techniques in Data Mining, 2005. URL: http://pythia.inf.brad.ac.uk/paper/BNCODWorkshop.pdf
Leslie Pack Kaelbling, Michael L. Littman & A. W. Moore. “Reinforcement Learning: A Survey”. Artificial Intelligence Research, Vol. 4, No. pp. 237-285, 1996. DOI: 10.1.1.134.2462
R. S. Sutton &A. G. Barto. “Reinforcement Learning: An Introduction”. 1998, Cambridge, Massachusetts: The IMT Press. ISBN: 978-0262193986
INTECHOPEN. “New Advances in Machine Learning”. 2010, InTech. 374p. ISBN 978-953-307-034-6
C. Germain-Renaud, A. Cady, P. Gauron, M. Jouvin, Ch. Loomis, et al. "The Grid Observatory". IEEE Computer Society Press. IEEE/ACM International Symposium on Cluster, Cloud, and Grid Computing, May 2011, Newport Beach, United States. 2011
Descargas
Archivos adicionales
Publicado
Cómo citar
Número
Sección
Licencia
De conformidad con las normas nacionales e internacionales sobre derechos de autor, las políticas de publicación de la Universidad Católica Luis Amigó y de la revista Lámpsakos (indexada con ISSN: 2145-4086), yo(nosotros), manifiesto(amos):
1. El deseo de participar como articulista(s) y someter a las normas editoriales establecidas por la revista (nombre la revista) el artículo titulado (nombre del artículo),
2. El compromiso de no retirar el artículo hasta no terminar el proceso de edición del número de la revista en curso.
3. Que el artículo es original e inédito y no ha sido postulado o presentado conjuntamente en otra(s) revista(s); por tanto, los derechos del artículo en cuestión no han sido cedidos con antelación y sobre ellos no pesa ningún gravamen ni limitación en su uso o utilización.
4. La inexistencia de conflicto de interés con institución o asociación comercial de cualquier índole.
5. Haber incorporado las citas y referencias de otros autores, tendientes a evitar el plagio. En consecuencia, afirmo que de ser publicado el artículo, no se violarán derechos de autor, de propiedad intelectual o de privacidad de terceros. Así mismo, de ser necesario, existe forma de evidenciar los permisos respectivos sobre derechos de autor originales para los aspectos o elementos extraídos de otros documentos como textos de más de 500 palabras, tablas, gráficas, entre otros. En caso de presentarse cualquier tipo de reclamación o acción por parte de un tercero en cuanto a los derechos de autor sobre el artículo, el(los) autor(es) asumirán toda la responsabilidad, y saldrán en defensa de los derechos aquí cedidos. Por tanto, para todos los efectos, la revista Lámpsakos de la Fundación Universitaria Luis Amigó actúa como un tercero de buena fe.
6. Que en el evento de publicarse el artículo, cedo(emos) a título gratuito y con carácter de exclusividad la integridad de los derechos patrimoniales así como los derechos de impresión, reimpresión y de reproducción por cualquier forma y medio, sin ninguna limitación en cuanto a territorio se refiere, en favor de la revista Lámpsakos de la Universidad Católica Luis Amigó.
7. Reconocer como coautores y/o colaboradores, a todos quienes participaron en ese rol y no se ha omitido a ninguno.