Q Learning Algorithm
Mostrando 1-7 de 7 artigos, teses e dissertações.
-
1. Compulsory Flow Q-Learning: an RL algorithm for robot navigation based on partial-policy and macro-states
Reinforcement Learning is carried out on-line, through trial-and-error interactions of the agent with the environment, which can be very time consuming when considering robots. In this paper we contribute a new learning algorithm, CFQ-Learning, which uses macro-states, a low-resolution discretisation of the state space, and a partial-policy to get around obs
Journal of the Brazilian Computer Society. Publicado em: 2009-09
-
2. Algoritmo Q-learning como estratégia de exploração e/ou explotação para metaheurísticas GRASP e algoritmo genético
Técnicas de otimização conhecidas como metaheurísticas têm obtido sucesso na resolução de problemas classificados como NP - Árduos. Estes métodos utilizam abordagens não determinísticas que geram soluções próximas do ótimo sem, no entanto, garantir a determinação do ótimo global. Além das dificuldades inerentes à complexidade que caracter
Publicado em: 2009
-
3. Uma implementação paralela híbrida para o problema do caixeiro viajante usando algoritmos genéticos, GRASP e aprendizagem por reforço
As metaheurísticas são técnicas conhecidas para a resolução de problemas de otimização, classificados como NP-Completos e vêm obtendo sucesso em soluções aproximadas de boa qualidade. Elas fazem uso de abordagens não determinísticas que geram soluções que se aproximam do ótimo, mas no entanto, sem a garantia de que se encontre o ótimo g
Publicado em: 2009
-
4. Rede perceptron com camadas paralelas (PLP - Parallel Layer Perceptron)
This work presents a novel approach to deal with the structural risk minimization (SRM) applied to a general machine learning problem. The formulation is based on the fundamental concept that supervised learning is a bi-objective optimization problem in which two conflicting objectives should be minimized. The objectives are related to the training error, em
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 18/12/2006
-
5. Aprendizagem por reforço na adaptação a obstáculos em navegação robótica autônoma não-estruturada baseada em imagens / Reinforcement learning for obstable avoidance in image based robotic autonomous non-structured navigation
In the last decades, robotic has become an important role for society, specially in the manufacturing industry. In recent times, applications of mobile robots, from simple toys to planets explorations, has shown how promising will be the use of these tools in a close future. Though, the cost and complexity in developing mobile robots nowadays, which should b
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 23/02/2006
-
6. Aprendizagem por reforço na adaptação a obstáculos em navegação robótica autônoma não-estruturada baseada em imagens / Reinforcement learning for obstable avoidance in image based robotic autonomous non-structured navigation
In the last decades, robotic has become an important role for society, specially in the manufacturing industry. In recent times, applications of mobile robots, from simple toys to planets explorations, has shown how promising will be the use of these tools in a close future. Though, the cost and complexity in developing mobile robots nowadays, which should b
Publicado em: 2006
-
7. HYPROSP: a hybrid protein secondary structure prediction algorithm—a knowledge-based approach
We develop a knowledge-based approach (called PROSP) for protein secondary structure prediction. The knowledge base contains small peptide fragments together with their secondary structural information. A quantitative measure M, called match rate, is defined to measure the amount of structural information that a target protein can extract from the knowledge
Oxford University Press.