Aprendizado Por Reforco
Mostrando 13-24 de 53 artigos, teses e dissertações.
-
13. Projeto e construção de um barco inteligente com integração INS/GPS e bússola
Este trabalho apresenta o projeto e construção de um barco inteligente, ou seja, com a capacidade de aprendizado e autônomo. Neste trabalho foi desenvolvida uma plataforma náutica dotada de sensores de posicionamento e de orientação visando gerar uma solução de navegação autônoma capaz de seguir uma trajetória pré-definida por um usuário. O bar
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 11/08/2011
-
14. Análise do modelo de Kiyotaki-Wright em simulações multiagentes que utilizam a plataforma Swarm / Analysis of the Kiyotaki-Wright Model in Multi-Agent Simulations that Use the Swarm Platform
O objetivo deste trabalho é realizar uma repetição metodológica dos trabalhos de Duffy, Ochs e Rouchier. Entretanto, ele possui um enfoque diferente. Dos vários modelos teóricoeconômicos que explicam o surgimento do dinheiro, um se destaca por sua simplicidade, eficiência e robustez: o modelo de Kiyotaki-Wright. Por este motivo, alguns economistas se
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 10/02/2011
-
15. A prática esportiva como ferramenta educacional: trabalhando valores e a resiliência
A sociedade brasileira vislumbra, na atualidade, o desafio de organizar e realizar megaeventos esportivos de grande impacto social. Nesse contexto, a atividade esportiva pode ser considerada uma ferramenta eficaz de intervenção psicossocial, especialmente com crianças e jovens. A presente pesquisa teve por objetivo investigar situações e vivências de a
Educação e Pesquisa. Publicado em: 2011-12
-
16. Aprendizado por reforço utilizando tile coding em cenários multiagente / Reinforcement learning using tile coding in multiagent scenarios
Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequa
Publicado em: 2011
-
17. Um algoritmo de aprendizado por reforço para redes neurais utilizando metaotimização estatística / A reinforcement learning algorithm for neural networks using statistical meta optimization
Esse trabalho analisa as principais técnicas de treinamento de redes neurais para problemas de aprendizado por reforço, e finalmente propõe um novo modelo utilizando suas melhores características, além de metaotimização baseada em amostragem estatística. O estudo tem por objetivos a obtenção de um método com alta taxa de sucesso, baixo número de
Publicado em: 2011
-
18. APRENDIZAGEM POR REFORÇO E PROGRAMACÃO DINÂMICA ADAPTATIVA PARA PROJETO E AVALIAÇÃO DO DESEMPENHO DE ALGORITMOS DLQR EM SISTEMAS MIMO / LEARNING BY STRENGTHENING AND ADAPTIVE DYNAMIC PROGRAMMING FOR DESIGN AND EVALUATION OF PERFORMANCE DLQR ALGORITHMS IN MIMO SYSTEMS
Em decorrência do crescente desenvolvimento tecnológico e das consequentes aplicações industriais, técnicas de controle de alto desempenho e aprendizado por reforço estão sendo desenvolvidas não só para solucionar novos problemas, mas também para melhorar o desempenho de controladores já implementados em sistemas do mundo real. As abordagens do ap
Publicado em: 2011
-
19. A connectionist approach for incremental function approximation and on-line tasks / Uma abordagem conexionista para a aproximação incremental de funções e tarefas de tempo real
Este trabalho propõe uma nova abordagem conexionista, chamada de IGMN (do inglês Incremental Gaussian Mixture Network), para aproximação incremental de funções e tarefas de tempo real. Ela é inspirada em recentes teorias do cérebro, especialmente o MPF (do inglês Memory-Prediction Framework) e a Inteligência Artificial Construtivista, que fazem com
Publicado em: 2011
-
20. Predição de Dados Estruturados Utilizando a Formulação Perceptron com Aplicação em Planejamento de Caminhos
O problema de planejamento de caminhos apresenta diversas subareas, muitas das quais ja extensamente abordadas na literatura. Uma dessas areas em especial e a de determina c~ao de caminhos, os algoritmos empregados para a soluc~ao deste problema dependem que os custos estipulados para os ambientes ou mapas sejam conaveis. A diculdade esta justamente na denic
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 18/06/2010
-
21. Aplicação da rede GTSOM para navegação de robôs móveis utilizando aprendizado por reforço / Using the GTSOM network for mobile robot navigation with reinforcement learning
Neste trabalho será descrita uma arquitetura de agente robótico autônomo projetada para ser capaz de criar uma representação de estado do ambiente e de realizar o aprendizado de tarefas simples em cima desta representação. A rede GTSOM (BASTOS, 2007) foi selecionada como método para classificação de estados. Sua tarefa é transformar os dados multi
Publicado em: 2010
-
22. Uma aplicação da apredizagem por reforço na otimização da produção em um campo de petróleo
O objetivo da engenharia de reservatórios é o de gerenciar campos de produção de petróleo de forma a maximizar a produção dos hidrocarbonetos obedecendo a restrições físicas e econômicas existentes. A definição de estratégias de produção é uma atividade complexa por envolver diversas variáveis do processo. Deste modo, um sistema inteligente
Publicado em: 2010
-
23. Aprendizado em sistemas multiagente através de coordenação oportunista. / Towards joint learning in multiagent systems through oppotunistic coordination
O tamanho da representação de ações e estados conjuntos é um fator chave que limita o uso de algoritmos de apendizado por reforço multiagente em problemas complexos. Este trabalho propõe o opportunistic Coordination Learning (OPPORTUNE), um método de aprendizado por reforço multiagente para lidar com grandes cenários. Visto que uma solução centra
Publicado em: 2010
-
24. Aprendizado por Reforço com Valores deInfluência em Sistemas Multi-Agente
Propomos um novo paradigma de aprendizado coletivo em sistemas multi-agentes (SMA) como uma solução para o problema em que vários agentes devem aprender como realizar tarefas agindo sobre um mesmo ambiente, simultaneamente, baseando-se em retornos fornecidos por cada um dos outros agentes. Introduzimos o paradigma proposto na forma do algoritmo de aprendi
Publicado em: 2009