Temas para TCC Aprendizado Por Reforco - Página 2 - Artigos Científicos Acadêmicos

Dificuldades para Fazer o seu TCC?

Conheça MÉTODO comprovado para acelerar ou SALVAR o seu TCC

Aprendizado Por Reforco

Mostrando 13-24 de 53 artigos, teses e dissertações.

13. Projeto e construção de um barco inteligente com integração INS/GPS e bússola

Este trabalho apresenta o projeto e construção de um barco inteligente, ou seja, com a capacidade de aprendizado e autônomo. Neste trabalho foi desenvolvida uma plataforma náutica dotada de sensores de posicionamento e de orientação visando gerar uma solução de navegação autônoma capaz de seguir uma trajetória pré-definida por um usuário. O bar

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 11/08/2011
14. Análise do modelo de Kiyotaki-Wright em simulações multiagentes que utilizam a plataforma Swarm / Analysis of the Kiyotaki-Wright Model in Multi-Agent Simulations that Use the Swarm Platform

O objetivo deste trabalho é realizar uma repetição metodológica dos trabalhos de Duffy, Ochs e Rouchier. Entretanto, ele possui um enfoque diferente. Dos vários modelos teóricoeconômicos que explicam o surgimento do dinheiro, um se destaca por sua simplicidade, eficiência e robustez: o modelo de Kiyotaki-Wright. Por este motivo, alguns economistas se

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 10/02/2011
15. A prática esportiva como ferramenta educacional: trabalhando valores e a resiliência

A sociedade brasileira vislumbra, na atualidade, o desafio de organizar e realizar megaeventos esportivos de grande impacto social. Nesse contexto, a atividade esportiva pode ser considerada uma ferramenta eficaz de intervenção psicossocial, especialmente com crianças e jovens. A presente pesquisa teve por objetivo investigar situações e vivências de a

Educação e Pesquisa. Publicado em: 2011-12
16. Aprendizado por reforço utilizando tile coding em cenários multiagente / Reinforcement learning using tile coding in multiagent scenarios

Atualmente pesquisadores de inteligência artificial buscam métodos para solucionar problemas de aprendizado por reforço que estão associados a uma grande quantidade de recursos computacionais. Em cenários multiagentes onde os espaços de estados e ações possuem alta dimensionalidade, as abordagens tradicionais de aprendizado por reforço são inadequa

Publicado em: 2011
17. Um algoritmo de aprendizado por reforço para redes neurais utilizando metaotimização estatística / A reinforcement learning algorithm for neural networks using statistical meta optimization

Esse trabalho analisa as principais técnicas de treinamento de redes neurais para problemas de aprendizado por reforço, e finalmente propõe um novo modelo utilizando suas melhores características, além de metaotimização baseada em amostragem estatística. O estudo tem por objetivos a obtenção de um método com alta taxa de sucesso, baixo número de

Publicado em: 2011
18. APRENDIZAGEM POR REFORÇO E PROGRAMACÃO DINÂMICA ADAPTATIVA PARA PROJETO E AVALIAÇÃO DO DESEMPENHO DE ALGORITMOS DLQR EM SISTEMAS MIMO / LEARNING BY STRENGTHENING AND ADAPTIVE DYNAMIC PROGRAMMING FOR DESIGN AND EVALUATION OF PERFORMANCE DLQR ALGORITHMS IN MIMO SYSTEMS

Em decorrência do crescente desenvolvimento tecnológico e das consequentes aplicações industriais, técnicas de controle de alto desempenho e aprendizado por reforço estão sendo desenvolvidas não só para solucionar novos problemas, mas também para melhorar o desempenho de controladores já implementados em sistemas do mundo real. As abordagens do ap

Publicado em: 2011
19. A connectionist approach for incremental function approximation and on-line tasks / Uma abordagem conexionista para a aproximação incremental de funções e tarefas de tempo real

Este trabalho propõe uma nova abordagem conexionista, chamada de IGMN (do inglês Incremental Gaussian Mixture Network), para aproximação incremental de funções e tarefas de tempo real. Ela é inspirada em recentes teorias do cérebro, especialmente o MPF (do inglês Memory-Prediction Framework) e a Inteligência Artificial Construtivista, que fazem com

Publicado em: 2011
20. Predição de Dados Estruturados Utilizando a Formulação Perceptron com Aplicação em Planejamento de Caminhos

O problema de planejamento de caminhos apresenta diversas subareas, muitas das quais ja extensamente abordadas na literatura. Uma dessas areas em especial e a de determina c~ao de caminhos, os algoritmos empregados para a soluc~ao deste problema dependem que os custos estipulados para os ambientes ou mapas sejam conaveis. A diculdade esta justamente na denic

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 18/06/2010
21. Aplicação da rede GTSOM para navegação de robôs móveis utilizando aprendizado por reforço / Using the GTSOM network for mobile robot navigation with reinforcement learning

Neste trabalho será descrita uma arquitetura de agente robótico autônomo projetada para ser capaz de criar uma representação de estado do ambiente e de realizar o aprendizado de tarefas simples em cima desta representação. A rede GTSOM (BASTOS, 2007) foi selecionada como método para classificação de estados. Sua tarefa é transformar os dados multi

Publicado em: 2010
22. Uma aplicação da apredizagem por reforço na otimização da produção em um campo de petróleo

O objetivo da engenharia de reservatórios é o de gerenciar campos de produção de petróleo de forma a maximizar a produção dos hidrocarbonetos obedecendo a restrições físicas e econômicas existentes. A definição de estratégias de produção é uma atividade complexa por envolver diversas variáveis do processo. Deste modo, um sistema inteligente

Publicado em: 2010
23. Aprendizado em sistemas multiagente através de coordenação oportunista. / Towards joint learning in multiagent systems through oppotunistic coordination

O tamanho da representação de ações e estados conjuntos é um fator chave que limita o uso de algoritmos de apendizado por reforço multiagente em problemas complexos. Este trabalho propõe o opportunistic Coordination Learning (OPPORTUNE), um método de aprendizado por reforço multiagente para lidar com grandes cenários. Visto que uma solução centra

Publicado em: 2010
24. Aprendizado por Reforço com Valores deInfluência em Sistemas Multi-Agente

Propomos um novo paradigma de aprendizado coletivo em sistemas multi-agentes (SMA) como uma solução para o problema em que vários agentes devem aprender como realizar tarefas agindo sobre um mesmo ambiente, simultaneamente, baseando-se em retornos fornecidos por cada um dos outros agentes. Introduzimos o paradigma proposto na forma do algoritmo de aprendi

Publicado em: 2009

Página 2 de 5

Sim, quero conhecer!

Obrigado, não estou interessada(o)

`