Apoyo a los Procesos de Toma de Decisiones: Las Restricciones de la Información y el Papel de las Herramientas de...

AutorH. Hernández y P. Canarelli
CargoIPTS

Apoyo a los Procesos de Toma de Decisiones: Las Restricciones de la Información y el Papel de las Herramientas de Extracción y Representación de Conocimientos.

Asunto: Los responsables de la toma de decisiones han de utilizar volúmenes cada vez mayores de información, generada por la creciente capacidad para obtener datos de una amplia variedad de fuentes. Esta tendencia va en paralelo con la creciente necesidad de una mejor comprensión de las complejas relaciones que existen entre todos los elementos de la actividad humana, en especial en lo que se refiere a la política y a la toma de decisiones. En este contexto, conviene mejorar la metodología utilizada para la obtención de conocimientos, utilizando todo su potencial para apoyar los procesos de toma de decisiones.

Relevancia: Las herramientas modernas de obtención de conocimientos pueden desempeñar un papel importante en el análisis de sistemas complejos y en el apoyo del análisis de sensibilidad y riesgo, previsiones y estudios de escenarios. Esto cobra especial importancia cuando se maneja información expresada de "forma humanística" (es decir, de forma no matemática), como por ejemplo opiniones de expertos, percepciones de riesgo y aceptación (por ejemplo de nuevos productos, tecnologías, etc.). No obstante, ya que no existe un método óptimo, susceptible de aplicación general, y cuya adecuación dependa de las características del sistema, la elección de uno u otro instrumento para la obtención de conocimientos puede sesgar y socavar el análisis e influir fuertemente sobre los procesos de decisión.

--------------------------------------------------------------------------------

  1. Procesos de decisión y sistemas de apoyo

    La teoría de la decisión es una rama fundamental de la investigación operativa y de la gestión de recursos, y su metodología se ha desarrollado en la frontera entre la matemática aplicada y la ingeniería de computación. En el pasado, los procesos de toma de decisiones se consideraban como optimizaciones matemáticas racionales sencillas, basadas principalmente en la programación lineal y en técnicas gráficas. Sin embargo, esta sobresimplificación daba lugar a representaciones de sistemas alejadas de las condiciones reales y, consiguientemente, de aplicaciones prácticas limitadas. Desde finales de la década de los 50, el Premio Nobel H. Simon planteó la necesidad de reformular los procesos de decisión para tener en cuenta las limitaciones tanto de la información como de la capacidad del hombre para procesarla (Simon, 1960). Simon propuso la formulación de metas realistas que reflejasen soluciones satisfactorias, en lugar de soluciones óptimas, y propuso adaptar los procesos de decisión al comportamiento heurístico ìhumanoî. Introdujo el concepto de tres fases interactivas e iterativas: fase de inteligencia, que comprende la adquisición de información y conocimientos, y fases de diseño y de elección, para construir posibles alternativas y seleccionar la mejor entre ellas (Figura 1).

    Figura 1. Principales componentes de los procesos de decisión

    (Figura Omitida)

    En los últimos veinte años, junto con la aparición de las tecnologías de la información, la teoría de la decisión ha evolucionado y ha dado lugar a la construcción de Sistemas Integrados de Apoyo a las Decisiones (SAD). Se ha desarrollado un gran número de instrumentos de SAD, en respuesta a la diversidad de problemas de decisión y a las necesidades de los responsables de la toma de decisiones. Entre los principales instrumentos de apoyo están los Sistemas de Información para la Gestión (SIG), que se aplican a todas las tareas de gestión; los Sistemas de Información para Ejecutivos (SIE), destinados a los ejecutivos de alto nivel; y los Sistemas de Apoyo a las Decisiones en Grupo (SADG), orientados a las crecientes necesidades de la comunicación y de los procesos de decisión en grupo. Se trata de instrumentos informáticos, basados en técnicas avanzadas de ingeniería de software, y que incorporan avances de otras disciplinas sobre el comportamiento humano y la teoría del conocimiento, proporcionando así interfaces convenientes para el usuario.

    Sin embargo, en la fase de inteligencia, la capacidad para extraer y representar el conocimiento continúa siendo un importante cuello de botella. Se observa un esfuerzo en esta dirección en los recientes intentos para integrar técnicas de Inteligencia Artificial (IA) en los SAD, en particular los llamados instrumentos basados en el conocimiento. En el siguiente capítulo, se muestra cómo la contribución de la IA es especialmente valiosa para los procesos de toma de decisiones que implican conocimiento ìhumanoî y sus problemas de representación asociados.

  2. Descubrimiento del conocimiento

    Las limitaciones analíticas planteadas por una información incompleta y compleja están empeorando, debido a la creciente capacidad para adquirir información. Esta tendencia se refuerza por el rendimiento, cada vez mayor, de las tecnologías de la información, que permiten construir enormes bases de datos y recoger información de fuentes diversas y en una amplia variedad de formatos. Así se sobrepasa la capacidad para procesar información y, en particular, se dificulta la metodología para extraer conocimiento útil. Los métodos y los instrumentos para abordar este problema se están reagrupando en campos nuevos, como los llamados descubrimiento del conocimiento y minería de datos (en inglés: knowledge discovery y data mining, Fayyad, 1996).

    En el contexto de la teoría de la decisión, el procedimiento de extracción de conocimiento (Figura 2) puede considerarse como una subdivisión de la fase de inteligencia, que exige un análisis en profundidad. La minería de datos se refiere sobre todo a los algoritmos para extraer pautas relevantes de las bases de datos y se utiliza habitualmente en los SIG. Mientras que el descubrimiento del conocimiento se refiere al proceso global de extracción del conocimiento y, al estar más próximo al campo de la IA, parece adecuado para problemas de decisión no estructurados.

    Estos campos abarcan un gran número de técnicas que tratan de cubrir el amplio ámbito de los sistemas y las aplicaciones. Sin embargo, no hay ninguna técnica o receta que pueda aplicarse para resolver cualquier sistema en general. En efecto, al contrario de lo que ocurre en la automatización de procedimientos en otras áreas, en este campo se precisa la contribución del analista para desarrollar o adaptar las técnicas disponibles a un problema específico. Hay dos características principales, que se solapan, y que determinan el tipo de técnica a utilizar. En primer lugar, el tipo de información relevante para el sistema, esto es, la cantidad y calidad de los datos disponibles. En segundo término, el número de variables implicadas en el sistema y sus interdependencias. Estas dos características definen el grado de representabilidad del sistema, que es un aspecto básico del descubrimiento del conocimiento.

    Figura 2. Procedimiento de extracción del conocimiento

    (Figura omitida)

    Fuente: Adaptado de Fayyad, 1996

    Técnicas de construcción de modelos

    La construcción de modelos es un elemento básico del método científico. En realidad, un modelo no es otra cosa que una agregación del conocimiento existente, que se estructura para utilizarlo de modo sistemático. A lo largo de los últimos cien años, se ha desarrollado un gran número de técnicas de construcción de modelos. En general, se pueden clasificar en dos grupos, según que manejen información cuantitativa o cualitativa.

    La información de partida viene expresada generalmente, bien mediante un conjunto de datos numéricos, bien mediante una descripción lingüística. Mientras el primer medio es relevante cuando la información es relativamente precisa y cuando la incertidumbre es baja, el segundo se adapta claramente al caso de información difusa o imprecisa, y concierne exclusivamente al saber ìhumanoî.

    Dada la gran diferencia entre estas dos representaciones de la información, no es extraño que los correspondientes técnicas para tratarla presenten grandes diferencias.

    Extracción de conocimiento a partir de datos

    En lo que se refiere a los datos que presentan ruido la extracción de conocimiento se basa esencialmente en el análisis estadístico, que cubre una amplia gama de técnicas específicas. Las más antiguas, por ejemplo desde el simple cálculo de probabilidades hasta el más complejo análisis de componentes principales, tienen un papel claramente descriptivo y pueden adaptarse peor a la construcción de modelos, por no hablar de sus deficiencias para tener en cuenta la no linearidad y el análisis multidimensional efectivo, que son dos aspectos importantes de las bases de datos actuales.

    Casi tan antigua, la regresión lineal, que se ha difundido ampliamente en las últimas décadas gracias a los ordenadores, conduce, por otra parte, a modelos completos, que relacionan las variables descriptivas de entrada con las variables dependientes de salida. Sin embargo, no se presta mayor atención al problema de tener en cuenta en los modelos la no linelridad presente en las relaciones entre las variables. Las redes neuronales permiten ir más allá. La arquitectura de una red neuronal imita la del cerebro, con sinapsis y neuronas. Supuesto que se le proporcione un conjunto representativo de datos, es capaz de aprender las relaciones (posiblemente no lineales) entre variables y puede conducir a una función global no lineal, representativa del problema en cuestión.

    Además de la descripción matemática, basada en funciones, son también posibles otros tipos de modelos, que utilizan reglas condicionales y ofrecen, por tanto, mayor transparencia del formato del conocimiento. Se conocen varios métodos para extraer conocimientos, basados en reglas, a partir de datos. Por ejemplo, los árboles de decisión, las redes neuronales difusas o los algoritmos genéticos basados en la selección natural. Estos últimos muestran la gran ventaja de destacar sólo la parte coherente y muy estructurada de la información (es decir, la parte útil), dejando a un lado la parte que continene ruido.

    Otra línea de análisis trata de comprender los sistemas dinámicos no lineales complejos, por ejemplo los que presentan propiedades auto-organizativas, regímenes caóticos o fuerte sensibilidad a las condiciones iniciales. Estos sistemas se encuentran abundantemente en la naturaleza y son la parte fundamental de los mecanismos de muchas actividades humanas. Las técnicas convencionales tienen una capacidad limitada para analizar tales sistemas; de aquí el interés de ciertas nuevas disciplinas, en particular la teoría del caos y la sinergética, que son de carácter más bien descriptivo pero, en algunos casos, pueden contribuir a mejorar la comprensión de tales sistemas.

    Extracción de conocimiento a partir de la experiencia humana

    El conocimiento ìhumanoî resulta bastante menos fácil de representar. Entre las principales dificultades cabe citar la gran proporción de conocimiento implícito, la baja precisión subyacente y la variedad de descripciones lingüísticas que se utilizan. Un primer paso necesario para tratar el conocimiento ìhumanoî es, pues, estructurarlo, esto es, seleccionar un número limitado de elementos y, posiblemente, agruparlos en categorías. Históricamente, el análisis estructural ha sido uno de los métodos más sencillos para procesar este conocimiento. Haciendo uso de una estructura muy simplificada de relaciones entre elementos (similar al formato binario), el análisis estructural hace posible este camino para extraer interdependencias de orden superior.

    Ir más allá de este sencillo análisis implica aproximarse a la Inteligencia Artificial. La Inteligencia Artificial es probablemente una de las aspiraciones más antiguas de la humanidad. Históricamente han existido dos enfoques, dos filosofías, asociados a ella. Un enfoque "duro", que consiste en imitar todos los aspectos de la mente humana, donde todavía queda un largo camino por recorrer; y un enfoque "blando" (y pragmático), que pretende capturar sólo los aspectos más sencillos y rudimentarios. Obviamente, este último ha alcanzado en gran parte sus objetivos, al difundirse durante las dos últimas décadas los sistemas expertos en casi todos los campos de actividad.

    Aunque los sistemas expertos han mostrado importantes limitaciones (por ejemplo un campo de conocimientos muy limitado y baja flexibilidad) han alcanzado, sin embargo, sus objetivos, ya que algunos aspectos del razonamiento humano se pueden imitar de forma funcional.

    Hoy día, los sistemas expertos difusos permiten aproximarse a una imitación del razonamiento deductivo humano. Como sus contrapartes más tradicionales, los sistemas expertos difusos se basan en reglas condicionales para almacenar el conocimiento emanado de la experiencia. Sin embargo, el enfoque difuso permite una mayor flexibilidad del razonamiento, con la posibilidad de evaluar el grado de aplicabilidad de cada regla, en función de un contexto dado. Todo el conjunto de reglas se combina después en un marco, obteniendo como resultado que las reglas más verdaderas son las que tienen mayor influencia (Canarelli, 1996).

    Este razonamiento deductivo, similar al humano, ofrece también la posibilidad de ajustar la precisión de la descripción a la de la experiencia existente, conduciendo a una familia de modelos que cubren la gama completa desde la descripción cualitativa a la cuantitativa.

  3. Un problema de decisión típico en el transporte urbano.

    Algunos de los temas discutidos hasta aquí pueden ilustrarse con un problema típico de decisión. Consideremos el caso hipotético de una ciudad europea de tamaño medio, que se enfrenta a problemas de congestión (y a la contaminación que lleva asociada). La zona comercial está delimitada al sur por un río y se conecta con las áreas de la parte norte mediante dos avenidas principales. Los accesos a esta zona se colapsan por completo en las horas punta. Entre las soluciones alternativas al problema cabe considerar la construcción de: i) otro puente; ii) otra avenida de acceso; iii) un tranvía.

    Para evaluar estas alternativas, cabe basarse en la gran cantidad de datos históricos reunidos durante el desarrollo de la ciudad. Estos datos pueden ser útiles para evaluar el grado de disminución de la congestión, en función de cada alternativa. Sin embargo, estas estimaciones de primer orden, basadas únicamente en las pautas pasadas de tráfico y crecimiento de población, difícilmente reflejarán la evolución de la ciudad a medio y largo plazo, ya que en este marco restringido no se incluyen importantes factores que conformarán el futuro. En realidad, las áreas urbanas son sistemas dinámicos muy complejos, cuya evolución es muy difícil de predecir. El transporte es sólo una de las variables fuertemente imbricadas en el sistema urbano, que depende de aspectos endógenos, pero también de factores exógenos (Forrester, 1969). Ejemplos de tales factores exógenos son las pautas sociales futuras (por ejemplo el estilo de vida o la aceptación de las tecnologías de la información), la evolución económica (por ejemplo el índice de desempleo y la tasa de crecimiento) y la evolución tecnológica (por ejemplo eficacia de la telemática aplicada al tráfico). El análisis de estos factores exógenos es bastante difícil, porque la información disponible suele ser incierta, vaga e imprecisa. En realidad, su fuente principal es, a menudo, la experiencia humana; por tanto, son necesarios modelos más adecuados para evaluar estas alternativas.

    Una solución interesante consiste en construir un modelo híbrido, elaborado a partir de información local, histórica y bien definida, que, a su vez, esté contenida en un marco más general, pero más difuso e incierto. Este modelo permitiría simular la evolución de cada alternativa (y finalmente actuar según ciertos criterios específicos) en el contexto de la supuesta evolución de algunos factores exógenos altamente inciertos. Mientras el componente histórico, basado en datos, puede basarse en modelos estadísticos más o menos convencionales, las técnicas basadas en la extracción de conocimientos podrían cubrir los aspectos más inciertos. Por ejemplo, se podría utilizar un modelo difuso, basado en reglas, para almacenar primero la experiencia humana existente y las hipótesis, y combinar después, finalmente, este conocimiento (Figura 3).

    Figura 3. Ejemplo de modelo híbrido. El sistema se descompone en dos bloques, según sus características y la información disponible: variables exógenas/endógenas, incertidumbre, constantes de tiempo, etc.

    (Figura Omitida)

    Los resultados de los dos enfoques pueden llevar a conclusiones muy diferentes. Las tendencias derivadas de los datos históricos sobre la ciudad sólo pueden mostrar, por ejemplo, que las pautas de vivienda y trabajo se desplazan rápidamente hacia la zona sur y que la experiencia de la construcción de avenidas ha mostrado una rápida adaptación de los usuarios que, en el pasado, se tradujo en una rápida disminución de la congestión en los accesos anteriores. La conclusión que se deriva inmediatamente de este análisis resalta, desde luego, los beneficios que se obtendrían de la construcción de un nuevo puente, y ésta sería, lógicamente, la elección de quienes han de tomar las decisiones.

    Por otra parte, el modelo híbrido general podría ampliar el análisis integrando una serie de experiencias, aparte de los temas específicos del transporte. Por ejemplo, el tamaño de las viviendas, que disminuye lentamente, o el rápido aumento de la preocupación por la seguridad personal en las áreas urbanas. El modelo híbrido podría también tener en cuenta otros aspectos, como el crecimiento del número de propietarios de automóviles o el aumento de la resistencia a utilizar el transporte público. Aunque la conclusión derivada del modelo reducido sería aún válida a corto plazo (en términos de congestión solamente), el modelo híbrido iría más allá, mediante la consideración de los escenarios resultantes de la evolución. Por ejemplo, podría demostrar los beneficios suplementarios, a medio y largo plazo, de la opción "tranvía" (supuesto que se traten adecuadamente los problemas de inseguridad) y los crecientes inconvenientes de la opción "puente", derivados de la construcción inducida de edificios alrededor del puente, con las consiguientes consecuencias para el tráfico.

    El interés del modelo híbrido ampliado reside, pues, en ampliar el contexto y ofrecer a los responsables de la decisión otros criterios (por ejemplo el aspecto importante del horizonte temporal) sobre los que basar su decisión.

  4. Conclusión

    El desarrollo de herramientas de apoyo a las decisiones y, en particular, su mejor tratamiento de la información y presentación al usuario, amplía su alcance para aplicaciones de gestión, pero no mejora necesariamente la calidad de las decisiones. Se necesitan más esfuerzos en la fase de inteligencia para desarrollar instrumentos que representen mejor el sistema. Ello viene subrayado por las necesidades de los responsables de la toma de decisiones, que deben manejar sistemas cada vez más complejos. Además, en los últimos años, la capacidad para adquirir información, rápidamente creciente, no garantiza per se una mejor adquisición de conocimientos. Por el contrario, dificulta el análisis y no alivia las limitaciones que plantean los datos inciertos o incompletos, o las dificultades para representar el conocimiento ìhumanoî. Por tanto, es necesario cambiar las prioridades desde la adquisición de información a su análisis. Deben realizarse esfuerzos para desarrollar y promover las técnicas de extracción de conocimientos, por ejemplo las técnicas basadas en el conocimiento derivadas de la IA, y reforzar el papel de los analistas científicos en este campo.

    --------------------------------------------------------------------------------

    Referencias

    Canarelli P., 1996, The method of fuzzy scenarios: principle and application to the future of congestion in urban centres, EUR Report (en prensa).

    Fayyad U., Piatetsky-Shapiro G., Smyth P., Uthurusamy S., editores, 1996, Advances in Knowledge Discovery and Data Mining, AAAI/MIT Press.

    Forrester, J.W., 1969, Urban Dynamics, MIT Press.

    Simon H.A., 1960, The New Science of Management Decision, Prentice Hall, Englewood Cliffs, N.J.

    Contacto/autores

    H. Hernández, IPTS, tel +34(9)5 448 8292, fax +34(9)5 448 8326, correo electrónico: hector.hernandez@jrc..es

    P. Canarelli, COMPLEX SYSTEMS, 18 rue d'Abbeville, 75009 París, tel/fax 33 1 40829312, correo electrónico: patrick.canarelli@filnet.fr

    CV

    --------------------------------------------------------------------------------

    Patrick Canarelli es doctor en Física. Actualmente es director gerente de COMPLEX SYSTEMS, una empresa consultora radicada en París, cuyas actividades principales son la minería de datos y los estudios de prospectiva, utilizando en ambos casos técnicas avanzadas de inteligencia artificial, tales como las redes neuronales, los algoritmos genéticos y la lógica difusa.

    Héctor Hernández posee el grado de doctor en ingeniería, en análisis de procesos industriales e ingeniería química. Actualmente es analista-investigador en el área de transportes y tecnologías industriales del IPTS.

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR