Hola,
¿eres nuevo aquí?

Regístrate gratis y conecta tu empresa con financiación pública, partners y proyectos.

Tengo cuenta

Regístrate

Ver video

PCIN-2017-082

Financiado

LA AUTONOMIA DE LARGO PLAZO QUE EVOLUCIONA DINAMICAMENTE

MUCHOS SISTEMAS AUTONOMOS COMPLEJOS (P,EJ, LAS REDES DE DISTRIBUCION ELECTRICA) REPETIDAMENTE SELECCIONAN ACCIONES CON EL FIN DE CONSEGUIR UN OBJETIVO DETERMINADO, EL APRENDIZAJE POR REFUERZO (REINFORCEMENT LEARNING, O RL) OFRECE... ver más

01/01/2017

UPF

120K€

Presupuesto del proyecto: 120K€

Líder del proyecto

UNIVERSITAT POMPEU FABRA No se ha especificado una descripción o un objeto social para esta compañía.

Total investigadores 321

Financiación concedida El organismo AGENCIA ESTATAL DE INVESTIGACIÓN notifico la concesión del proyecto el día 2017-01-01 No tenemos la información de la convocatoria

0% 100%

Participantes

UPF

Lider

Conecta tu I+D

¿Tienes un proyecto y buscas un partner? Gracias a nuestro motor inteligente podemos recomendarte los mejores socios y ponerte en contacto con ellos. Te lo explicamos en este video

Proyectos interesantes

CORNEA Controlling evolutionary dynamics of networked autonomous ag... 2M€ Cerrado

TIN2009-13839-C03-03 ORGANIZACIONES VIRTUALES ADAPTATIVAS: DELIBERACION, SIMULACI... 349K€ Cerrado

TIN2009-13839-C03-01 ORGANIZACIONES VIRTUALES ADAPTATIVAS: ARQUITECTURAS Y METODO... 283K€ Cerrado

JCI-2008-2619 Argumentation and Learning in Multi-Agent Systems 101K€ Cerrado

TIN2008-06701-C03-02 PLANNING, EXECUTION AND LEARNING ARCHITECTURE 53K€ Cerrado

Líder del proyecto

UNIVERSITAT POMPEU FABRA No se ha especificado una descripción o un objeto social para esta compañía.

Total investigadores 321

Presupuesto del proyecto 120K€

Descripción del proyecto MUCHOS SISTEMAS AUTONOMOS COMPLEJOS (P,EJ, LAS REDES DE DISTRIBUCION ELECTRICA) REPETIDAMENTE SELECCIONAN ACCIONES CON EL FIN DE CONSEGUIR UN OBJETIVO DETERMINADO, EL APRENDIZAJE POR REFUERZO (REINFORCEMENT LEARNING, O RL) OFRECE UNA INFRAESTRUCTURA PODEROSA PARA ADQUIRIR COMPORTAMIENTO ADAPTIVO EN ESTE CONTEXTO, ASOCIANDO UN REFUERZO ESCALAR CON CADA ACCION Y APRENDIENDO POR EXPERIENCIA QUE ACCION SELECCIONAR PARA MAXIMIZAR EL REFUERZO DE LARGO PLAZO, AUNQUE RL HA PRODUCIDO RESULTADOS IMPRESIONANTES RECIENTEMENTE (P,EJ, CONSEGUIR UN NIVEL COMPARABLE AL HUMANO EN LOS JUEGOS DE ATARI Y GANAR AL CAMPEON MUNDIAL EN EL JUEGO DE TABLERO GO), LA MAYORIA DE SOLUCIONES EXISTENTES SOLO FUNCIONAN BAJO RESTRICCIONES FUERTES: EL MODELO DEL ENTORNO ESTA ESTACIONARIO, EL OBJETIVO ESTA INALTERABLE Y LOS EXPERIMENTOS ACABAN UNA VEZ QUE EL OBJETIVO SE HA CONSEGUIDO,ESTE PROYECTO ASPIRA A AVANZAR EL ESTADO DE ARTE DE LA INVESTIGACION FUNDAMENTAL DEL LIFELONG RL (ES DECIR, LOS ALGORITMOS QUE SIGUEN APRENDIENDO DURANTE UN PERIODO EXTENSO), DESARROLLANDO VARIOS ALGORITMOS NUEVOS DE RL QUE RELAJAN LAS RESTRICCIONES MENCIONADAS ARRIBA, LOS ALGORITMOS NUEVOS DEBERIAN SER ROBUSTOS A LOS CAMBIOS EN EL ENTORNO, TANTO EN TERMINOS DE LAS OBSERVACIONES QUE EL SISTEMA PUEDE HACER, COMO DE LAS ACCIONES QUE EL SISTEMA PUEDE TOMAR, ADICIONALMENTE, LOS ALGORITMOS DEBERIAN SER CAPACES DE OPERAR DURANTE LOS PERIODOS LARGOS DE TIEMPO Y CONSEGUIR OBJETIVOS DIFERENTES,LOS ALGORITMOS PROPUESTOS ABORDARAN TRES PROBLEMAS CLAVE RELACIONADOS CON EL LIFELONG RL: LA PLANIFICACION, LA EXPLORACION Y LA DESCOMPOSICION EN TAREAS, LA PLANIFICACION ES EL PROBLEMA DE CALCULAR UN ESTRATEGIA DE SELECCION DE ACCIONES DADO UN MODELO (POSIBLEMENTE PARCIAL) DE LA TAREA POR RESOLVER, LA EXPLORACION ES EL PROBLEMA DE SELECCIONAR ACCIONES CON EL FIN DE MAPEAR EL ENTORNO EN VEZ DE CONSEGUIR UN OBJETIVO PARTICULAR, LA DESCOMPOSICION EN TAREAS ES EL PROBLEMA DE DEFINIR DIFERENTES OBJETIVOS Y ASIGNAR UN ESTRATEGIA DE SELECCION DE ACCIONES DIFERENTE PARA CADA UNO, LOS ALGORITMOS SE EVALUARAN EN DOS ESCENARIOS REALISTAS: LA GESTION ACTIVA DE LAS REDES DE DISTRIBUCION ELECTRICA, Y LA GESTION DE LAS MICROREDES, UN PROTOCOLO DE TESTEO SE DESARROLLARA PARA EVALUAR TANTO CADA ALGORITMO INDIVIDUAL COMO LA COMBINACION DE ELLOS, SISTEMAS AUTÓNOMOS\APRENDIZAJE POR REFUERZO\APRENDIZAJE DE LARGO PLAZO\PLANIFICACIÓN\EXPLORACIÓN\DECOMPOSICIÓN EN TAREAS

Conecta tu I+D

Entra hoy

¿Olvidé mi contraseña?

Financiación

Empresas

CTIs/Universidades

Proyectos

Investigadores