martes, 12 de agosto de 2008

REDES BAYESIANAS

INTRODUCCIÓN

Las Redes Bayesianas son utilizadas para sistemas expertos, debido a que se pueden realizar reglas de inferencia bayesiana que ayudan a estos sistemas a ser más inteligentes, estas reglas de inferencia sirven para estimar la probabilidad posterior de las variables no conocidas, en base a las variables conocidas.

Las redes bayesianas tienen muchas aplicaciones; se las puede aplicar para clasificación, predicción, diagnóstico, etc.

Al principio estos modelos se los realizaba a mano; pero en la actualidad existen diversas técnicas para efectuar aprendizaje a partir de los datos que resultan de la aplicación de este modelo a variables de un mundo conocido.

Definición


Las Redes Bayesianas son un grafo acíclico dirigido que consta de nodos que representan las variables aleatorias y los arcos son las dependencias probabilísticas de cada variable, las redes bayesianas son un conjunto de variables aleatorias representadas en un grafo dirigido, el arco entre dos variables x e y, significa una influencia directa de x sobre y.

Los nodos son cualquier variable como por ejemplo variables que se pueden medir, variables latentes o hipótesis. Las redes bayesianas son utilizadas para sistemas expertos y se pueden utilizar diversos tipos de algoritmos para recopilar conocimiento par a estos sistemas.

Figura 1. Ejemplo de una red bayesiana [1]




Los nodos representan variables aleatorias y los arcos las relaciones de dependencia. En esta red observamos que [1]:



  • Caries es una causa directa de Dolor y Huecos
  • Dolor y Huecos son condicionalmente independientes dada Caries
  • Tiempo es independiente de las restantes variables

Tiempo es independiente de las restantes variables

Existen diferentes tipos de redes bayesianas [2]:


Naive Bayes = bayes “ingenuo” o Idiot's Bayes
Forma de “V” => 2 ^ n estados en el nodo inferior

DBNs = Redes Bayesianas Dinámicas
Cambian con el tiempo (t, t+1, t+2...)
Lo pasado en t, tiene relación con lo que suceda en t+1

Redes Gaussianas = distribución gaussiana
Para nodos con variables continuas

Cadenas de Markov = subconjunto de las RB


Aplicaciones

Las redes bayesianas tienen múltiples aplicaciones, se puede aplicar este modelo en empresas que necesiten diagnosticar problemas o fallos o también para minería de datos.
A continuación tenemos algunos campos en donde podemos aplicar las redes bayesianas [3]:

Prevención del fraude
Prevención del abandono de clientes
Blanqueo de dinero
Marketing personalizado
Mantenimiento preventivo
Clasificación de datos estelares

Aplicaciones en empresas [1]:

Microsoft: Answer Wizard (Office), diagnostico de problemas de impresora.
Intel: Diagnostico de fallos de procesadores
HP: Diagnostico de problemas de impresora
Nasa: Ayuda a la decisión de misiones espaciales

Referencias

[1] José L. Ruiz Reina, Introducción a las Redes Bayesianas, Dpto. de Ciencias de la Computación e Inteligencia Artificial Universidad de Sevilla, disponible en:
http://www.cs.us.es/cursos/ia2-2005/temas/tema-08.pdf
[2] Álvaro Marín Illera, Sistemas Expertos, Redes Bayesianas y sus aplicaciones, Semana ESIDE, Abril 2005, Universidad de Deusto, disponible en:
http://www.e-ghost.deusto.es/docs/2005/conferencias/Bayes05.pdf

[3] Red bayesiana, disponible en: http://es.wikipedia.org/wiki/Red_bayesiana

[4] Jorge Luís Guevara Díaz, Redes Bayesianas, disponible en: http://jorge.sistemasyservidores.com/si_2008i/clases/claseiarazonamientoprobabilistico.pdf

[5] Carlos López de Castilla Vásquez, Clasificadores Por Redes Bayesianas, Universidad de Puerto Rico, disponible en:
http://grad.uprm.edu/tesis/lopezdecastilla.pdf


MODELOS OCULTOS DE MARKOV

Un modelo oculto de Markov o HMM (por sus siglas del inglés, Hidden Markov Model), es un proceso por el cual se observa el comportamiento del sistema de manera indirecta pues los estados del mismo permanecen ocultos para el observador.

El objetivo principal es encontrar los valores desconocidos a partir de parámetros observables, estos modelos describen un proceso de probabilidad el cual produce una secuencia de parámetros observables, se denominan ocultos por que existe probabilidades ocultas que afectan al resto de estados observados.

Un modelo oculto de Markov es un conjunto finito de estados probabilísticos, en el que el estado esta conectado a otro por un arco de transición, en donde cada arco tiene diversas probabilidades que pueden cambiar en algún instante del tiempo, entonces se puede decir que el sistema se encuentra en uno de los posibles estados y habrá un cambio de un estado a otro en intervalos iguales de tiempo.

Figura 1. Ejemplo de un modelo de Markov [1]







Probabilidad de que el día permanezca, lluvioso, nubloso soleado

Cada estado (S + 1) depende del estado anterior S y no del progreso del sistema.

Tipos de HMM

Los modelos ocultos de Markov se clasifican según la función de la matriz de distribuciones de probabilidad de emisión, estos son:


HMM discretos

En este modelo las observaciones son vectores de símbolos de un alfabeto finito con M + 1 elementos diferentes, en este caso se define el número de símbolo observables M, el conjunto de estados, y las probabilidades que definen el modelo oculto de Markov.

HMM continuos

Las probabilidades que dominan la emisión de los parámetros observables están definidas sobre espacios de observación continuos, se restringe la forma de distribuciones para obtener un número manejable de parámetro a estimar.


HMM semicontinuos

Para aplicar este modelo se debe realizar un entrenamiento a varios modelos con bases de datos limitadas, estos modelos al igual que los continuos se realizan a partir de combinaciones de distribuciones probabilísticas. La diferencia de estos modelos es que las funciones base son comunes en todos los modelos.

Referencias

[1] Luís Miguel Bergasa Pascual, Introducción a los modelos ocultos de Markov, Departamento de electrónica, Universidad de Alcalá, disponible en: http://www.depeca.uah.es/docencia/doctorado/cursos04_05/82854/docus/HMM.pdf

[2] Redes Neuronales y Modelos Ocultos de Markov, disponible en: http://catarina.udlap.mx/u_dl_a/tales/documentos/lis/clemente_f_e/capitulo2.pdf

[3] Basilio Sierra Araujo, Aprendizaje Automático: Conceptos básicos y avanzados.