Inicio » ¿Qué es evaluación? » Una primera aproximación a la evaluación

Archivos de la categoría: Una primera aproximación a la evaluación

Ramas y campos de la Evaluación

En la extensión de esta cultura evaluadora, la práctica profesional de la evaluación ha dado lugar a numerosas ramas y campos. Algunas de estas ramas comienzan a tener ya una larga experiencia en el desarrollo de metodologías de evaluación y en su aplicación práctica. Scriven destaca siete de estas ramas (las siete grandes, Big Seven):

  1. Evaluación de productos, como los de consumo.
  2. Evaluación de rendimientos, como los exámenes a estudiantes.
  3. Evaluación de propuestas, para elegir la mejor alternativa entre las posibles.
  4. Evalaución de personal, para escoger los mejores candidatos para determinadas funciones.
  5. Evalaución de carteras.
  6. Evaluación de políticas.
  7. Evaluación de programas y proyectos, para analizar el impacto de las intervenciones, su aplicación y lógica de intervención.

En algunas de estas ramas se lleva trabajando en evaluación desde tiempos inmemoriales dando lugar a prácticas experimentadas y especialistas, luego a gremios, y ya en el siglo XX profesiones que dan lugar al actual campo profesional de la evaluación. Hay también muchas actividades pseudoevaluativas que, aunque con mucha tradición, carecen de requerimientos básicos como la validación de estándares. Es el caso de mucha de la crítica literaria y artística y otras áreas que no han caído en la cuenta de que la evaluación ha evolucionado independientemente de sus ramas de origen y tiene mucho que aportarles. Cada una de estas ramas comentadas se aplica en campos diversos desde la salud pública al trabajo social, pasando por la física o el campo de la cooperación al desarrollo. En cada uno de estos campos es más tradicional un tipo de evaluación u otra, siendo común en el campo del desarrollo y la cooperación la evaluación de carteras, políticas y programas, y también suele hablarse de evaluación de proyectos.

 

Referencias citadas:

Scriven, M. (2005b). Logic of evaluation. En: S. Mathison (Ed.), Encyclopedia of evaluation (pp. 235-238). Thousand Oaks: Sage Publications. Bajado de la red el 13 de Mayo de 2015 de http://www.sagepub.com/chambliss4e/study/chapter/encyc_pdfs/11.2_Logic%20of%20Evaluation.pdf

Seis dimensiones de evaluación

De acuerdo con Scriven (2007) existen cinco dimensiones de evaluación o aspectos susceptibles de ser evaluados: el proceso, los resultados, los costes, comparativas y generalizaciones, al que conviene añadir la lógica de intervención. En todas estas dimensiones es necesario estudiar los hechos acontecidos y combinarlos adecuadamente con los valores aplicables a cada situación para determinar el mérito, valor e importancia de esos hechos. Las dimensiones de la lógica de intervención, el proceso y los resultados son los que principalmente determinan el mérito derivado de las características intrínsecas de lo que evaluamos. El resto de dimensiones (costes, comparativas y generalizaciones) se definen en relación a valores específicos de gran importancia general que les da el nombre a estas dimensiones. Los costes y comparativas son especialmente relevantes a la hora de determinar el valor referencial a una moneda u otro referente que se considere adecuado, y las comparativas y generalizaciones son las que llevan el peso a la hora de determinar la importancia en relación al contexto y las personas que rodean lo que evaluamos.

En la evaluación de intervenciones de desarrollo no es necesario emplear siempre todas ellas, y en función de cada caso habrá que escoger las que resulten de mayor utilidad.

 

Lógica de intervención

Una dimensión importante es la evaluación de la lógica de intervención. Ésta se centra en analizar la visión, diseño y planificación realizada: su calidad, necesidad, pertinencia y coherencia con la realidad del territorio.

La lógica de una intervención explica cómo las actividades a implementar van a conducir a los resultados en el contexto de una intervención. Esta lógica ha de estar descrita en los documentos de planificación donde han de concretarse los objetivos esperados. Es importante tener en cuenta que se trata de una simplificación útil de la realidad y ser consciente de la complejidad del mundo real. Las explicaciones causales reales a menudo se revelan más complejas que los supuestos establecidos al inicio. No es bueno hacer depender la evaluación de la resolución del misterio de la causalidad, que no siempre es fácil y a veces absorbe un esfuerzo grande y de poca utilidad. Al reconstruir la lógica de intervención en el momento de la evaluación pueden tenerse en cuenta además otros resultados y factores externos que no fueron evocados en los documentos de planficación iniciales, pues además de la complejidad, con frecuencia la lógica de intervención evoluciona a través del tiempo.

Las representaciones más comunes de una lógica de intervención son:

  • Marco lógico: Esta técnica consiste en producir una presentación en forma de matriz que especifique los objetivos (primera columna), cómo se los deberá verificar (segunda columna: indicadores, y tercera columna: fuentes) y los principales supuestos acerca de los factores externos (cuarta columna). Las líneas del marco lógico retoman una presentación simplificada de la lógica de intervención, en sólo cuatro líneas: actividades, resultados, finalidad y objetivo global. Esta representación es conveniente para una intervención simple sin excesiva complejidad.
  • Diagrama de objetivos: Esta técnica funciona por medio de la identificación de los objetivos de una intervención y una presentación gráfica que muestre las cadenas lógicas entre objetivos, desde los más operativos hasta los más globales. La lógica de intervención está representada en forma de casillas y de flechas y es útil en los casos de intervenciones más complejas. Contrariamente al marco lógico, el diagrama puede tener cadenas de objetivos tan largas como sea necesario y representar sinergias y relaciones complejas entre objetivos. Una forma particular y sencilla de representación consiste en el árbol de objetivos que se aplica cuando cada objetivo de rango inferior contribuye a un solo objetivo de rango superior.
  • Diagrama de resultados esperados: Esta técnica se asemeja al diagrama de objetivos ya que se apoya en los objetivos planificados para una intervención. Sin embargo, los objetivos se traducen en resultados esperados antes de ser presentados en un diagrama. La traducción de los objetivos en resultados esperados permite trabajar con conceptos más concretos y más fáciles de verificar.

 

Proceso

En unos casos las actividades de evaluación pueden centrarse en el estudio de los procesos de desarrollo, analizando la aplicación y gestión de la intervención, lo cual suele ser más interesante que el mero análisis de los resultados de cara a plantear mejoras. Hay una tendencia bastante extendida en el mundo de la evaluación de centrarse en los resultados e impactos, sin embargo poner énfasis en el estudio del proceso suele resultar de gran interés.

Se trata de evaluar el mérito, valor e importancia de todo lo que ocurre antes de darse los resultados (outcomes): la aplicación y gestión del programa, la fidelidad de la implementación al diseño de programación realizado (alineamiento), el seguimiento o monitoreo y el aprendizaje originado de su retroalimentación (errores subsanados, soluciones diseñadas). Se trata de examinar todas las actividades y procedimientos, los procesos generales de aprendizaje para lidiar con los cambios. Analizar las realizaciones más inmediatas y materiales (resultados inmediatos, outputs) antes de darse los verdaderos resultados e impactos.

 

Resultados

Muy communmente la evaluación puede centrarse en los resultados de la intervención mediante el análisis de sus diversos efectos: positivos y negativos, directos e indirectos, intencionales o no, y a corto (output), medio (outcome) y largo plazo (impact); efectos en los beneficiarios, en otras personas o en el medioambiente; efectos a nivel individual, organizacional o a nivel del capital social; efectos en las capacidades y potencial de las personas, que aunque no son necesariamente logros o productos observables, es importante tenerlos en cuenta.

En ocasiones es útil proporcionar explicaciones sobe el éxito o fracaso en relación a las decisiones tomadas, el contexto, las medidas…, identificar las claves del éxito de determinados programas o medidas. Y dado que los resultados más importantes puede ser que no sean intencionados ni anticipados, merece la pena distinguir entre efectos secundarios (side effects, que afectan a la población objetivo y a otros) e impactos secundarios (side impacts, impactos de cualquier tipo entre la población no objetivo del programa).

El mayor problema metodológico de la evaluación concerniente a esta dimensión está en establecer la conexión causal, especialmente cuando hay muchas posibles causas y posibles atribuciones de partes del efecto a cada de ellas. Otro problema es la frecuencia con la que las evaluaciones han de hacerse y terminarse antes de que los verdaderos resultados lleguen a darse, lo que hace que se dependa de predicciones basadas en pequeñas muestras y de las conjeturas y suposiciones que acompañan a estas siempre arriesgadas predicciones.

 

Costes

Muy relacionada con esta dimensión de resultados está la evaluación de costes donde se pueden analizar costes monetarios y no monetarios, directos e indirectos y costes actuales y de oportunidad. Esta dimensión es crucial a la hora de determinar el valor (worth).

Cuando sea posible estos costes han de ser pormenorizados por estados de desarrollo y periodos de calendario, tipos de coste en los que se ha incurrido (renta, equipamiento, personal…) y destinatarios de los pagos. Han de incluirse los costes no monetarios como son el espacio, el tiempo, la experiencia; así como los costes menos medibles como el estrés, capital personal o social (e.g. reputación o buena voluntad) o impactos medioambientales

 

Comparativas

En esta dimensión se compara la intervención evaluada con otras intervenciones con las que se buscan unos beneficios similares partiendo de recursos parecidos. Se entra aquí a la búsqueda de entidades que supongan formas alternativas para lograr beneficios iguales o similares con los mismos o menos recursos (competidores críticos). Merece la pena buscar y describir al menos una alternativa que es mucho más barata pero no mucho menos efectiva, y otra alternativa mucho más efectiva aunque más cara (siempre dentro de los límites de los recursos disponibles). A veces es útil comparar la intervención evaluada con un enfoque ampliamente extendido y admirado que sea percibido como alternativa (e.g. un icono local), o con una alternativa virtual factible en la teoría (competidor virtual) que pueda ser diseñado a partir de componentes existentes o fácilmente construidos. Esta última alternativa puede crear un conflicto de intereses al entrar el evaluador en un papel de planificador y poder perder objetividad a la hora de evaluar su propio diseño frente a la intervención evaluada.

En cualquier caso las comparativas con las alternativas que estén disponibles son a menudo esclarecedoras y algunas veces incluso esenciales. Suele ser tentador reunir en un mismo análisis las dimensiones de coste y comparativa en una comparativa de coste-eficacia pero es mejor mantener ambas dimensiones separadas por el interés de tener los resultados por separado. No todas las alternativas son comparables en costes y el coste no es muchas veces el elemento más importante de las comparativas.

 

Generalizaciones

Bajo esta dimensión la evaluación busca analizar hasta qué punto la intervención evaluada o alguno de sus componentes puede generalizarse en otras condiciones con resultados similares. Las generalizaciones pueden hacerse para otras situaciones (físicas, políticas, etc.), otro personal, otra escala territorial o temporal (ampliarla o también reducirla), otros beneficiarios, etc. Son las llamadas dimensiones de generalización y son importantes de cara a señalar el mérito e importancia del programa evaluado pues aquí se responde a si el programa puede usarse con éxito al aplicar cambios en estas dimensiones. Este tipo de planteamientos son típicamente usados a la hora de analizar si un programa aplicado a un pequeño grupo de beneficiarios podría tener éxito a una mayor escala. También se usan las generalizaciones en el tiempo para analizar la longevidad, durabilidad (ante condiciones adversas) o la sostenibilidad.

Para realizar este tipo de evaluación es necesario hacer predicciones sobre los resultados de una intervención en distintos escenarios. A pesar del riesgo de este tipo de predicciones, este tipo de evaluación es en ocasiones el que más potencial tiene para contribuir a la mejora de los programas. Muestra además que la evaluación no es siempre un ejercicio reactivo sino también creativo.

 

Referencias citadas:

Scriven, M. (2007). Key evaluation checklist. Retrieved May 12, 2015, from http://www.wmich.edu/evalctr/archive_checklists/kec_feb07.pdf

Glosario de términos técnicos de evaluación

glosario

Dentro del contexto de los planes y programas de desarrollo se encuentran frecuentemente problemas de vocabulario porque el S&E se ha efectuado en un contexto internacional e intersectorial, entre personas que no comparten la misma lengua materna ni las mismas referencias profesionales. Además, debido al reciente desarrollo de estas actividades, a muchos actores les es desconocido el vocabulario estándar que no está siempre estabilizado. Los problemas de comunicación resultantes pueden hacer perder tiempo y energía, e incluso comprometer la calidad o la utilidad de los trabajos.

tabla

Términos técnicos en el ámbito del seguimiento y evaluación del desarrollo.
Fuente: Elaboración propia.

El propósito de este anexo es contribuir hacia la estabilización y clarificación del vocabulario – principalmente en los países de habla española – partiendo del glosario de términos elaborado en el tomo VI de la colección MEANS actualmente en inglés y francés . Los términos estudiados se refieren principalmente al S&E de un programa de desarrollo, pero también puede interesar a los lectores que dirijan o realicen evaluaciones temáticas o evaluaciones en profundidad en dominios más limitados. Es por ello por lo que el término ‘intervención’ es utilizado numerosas veces, en sentido genérico, para denotar cualquier objeto de seguimiento y evaluación.

Construyendo un sistema de valores

Una de los principales activos de un profesional de la evaluación es el sistema de valores que utiliza para realizar sus evaluaciones. Este sistema constituye la fundamentación y una de sus principales aportaciones al trabajo que realiza, la base necesaria para los juicios de valor con los que ha de concluir sus evaluaciones. Este sistema lo construye cada evaluador a medida que se va ganando experiencia, lo que no significa que cambie y por tanto goce de cierto relativismo. Más bien lo que significa es que el evaluador va profundizando en la realidad objetiva con la que trabaja, descubriendo nuevos valores que se le podían haber pasado por alto, o calibrando la importancia relativa entre los valores que ya maneja.

valores

El contexto en el que se trabaja hace que se apliquen unos valores u otros, o se de una importancia mayor a unos que a otros. Es el caso de hacer una evaluación de programas de desarrollo rural en un país desarrollado frente a hacerla en un país en vías de desarrollo. En el primer caso el contexto puede hacer aflorar la importancia de los valores medioambientales, en el segundo caso, un contexto donde la gente muere de hambre puede ensombrecer los valores medioambientales. Esta circunstancia no debe confundirse con el relativismo. La realidad sigue siendo la que es y los valores que la fundamentan también. Los dos contextos están fundamentados por unos mismos valores —e.g. el valor de la vida humana y el valor de los bienes medioambientales— simplemente afloran unos valores u otros, y su importancia relativa, a la hora de realizar un juicio de valor. En los dos casos el valor de la vida humana es preponderante, pero en el caso del país desarrollado puesto como ejemplo se respeta y se cuida ese valor, circunstancia que permite poner el foco de la evaluación en otro tipo de valores.

 

La pregunta que podemos hacernos aquí es ¿cómo se construye un sistema de valores?, ¿de qué fuentes se nutre un sistema de este tipo? Enumeramos a continuación algunas de las fuentes más comunes:

  • Valoración de necesidades (needs assessment): una primera fuente de valores surge durante el proceso de diagnóstico y la observación de las necesidades existententes en un determinado contexto.
  • Definición y comprensión del objeto a evaluar (definitional): en el caso de un programa de desarrollo una fuente común de valores está relacionada con la definición de los impactos (sociales, económicos, ambientales) esperados.
  • Lógica: otra fuente de valores está relacionada con el propio razonamiento de forma que lo que se evalue esté formalmente de acuerdo con los principios básicos de la razón.
  • Marco legal: valores que derivan de la legislación vigente que pueda ser aplicable o valores acordados con quien patrocina la evaluación y que normalmente pone unos requerimiento iniciales.
  • Ética: valores que en muchas ocasiones pueden no estar incluidos en el marcol legal, o incluso pueden rebatir algunos de los valores legales.
  • Marco personal y organizacional: En relación a los objetivos personales u organizacionales de aquellos individuos u organizaciones implicados en una evaluación.
  • Fidelidad: normalmente en relación a la implementación de un determinado programa y la fidelidad a la misión con que fue creado.
  • Estándares profesionales: valores establecidos por autoridad, costumbre o consentimiento general.
  • Juicio experto: relacionado normalmente con los estándares más comúnmente usados y elegidos por expertos profesionales.
  • Estándares históricos, tradicionales y culturales: normalmente variables en función del tiempo y del contexto.
  • Mérito científico y tecnológico.
  • Políticos: pueden ser algo artificiosos e interesados, y hay que abordarlos con cierto cuidado.
  • Riesgo: en relación al daño potencial, su probabilidad, su grado de incertidumbre…

Fundamentación teórica de la evaluación: Teorías del valor y teorías de la práctica

La fundamentación teórica de la evaluación se asienta en las teorías del valor y las teorías de la práctica. Éstas últimas hacen referencia al papel de evaluador, objetivos, métodos y usos de evaluación, la naturaleza de las evidencias… temas que trataremos con extensión en otros artículos. Abordamos aquí las teorías del valor, que estudian la naturaleza del valor y su relación con los hechos.

valores
La cuestión de fondo es que ha habido, y hay hoy en día, ámbitos científicos que desprecian las ciencias sociales al considerar que son cuestión de juicios subjetivos que no llevan a hacer verdadera ciencia. Podríamos considerar que ese hacer ciencia consiste en establecer leyes generales, y en ciencias sociales aunque es más difícil no es imposible establecerlas. No todo ha de ser probado por el método científico: observación sistemática, medición, experimentación, la formulación, análisis y modificación de hipótesis. De hecho sabemos con certeza muchas cosas que no han sido probadas por el método científico, por ejemplo el hecho de que los Andes se han levantado por la subducción de placas oceánicas por debajo de la placa Sudamericana.
El problema es que ese desprecio está contribuyendo a mermar la contribución que las ciencias sociales pueden hacer a la sociedad. Hay oportunidades que aprovechar y problemas importantes que resolver: el hambre, la pobreza, la corrupción, el narcotráfico, la violencia, el desempleo… La cuestión está en que no podemos hablar de estas cuestiones sin entrar a términos evaluativos, esa es la razón por la que la cultura de la evaluación está entrando con tanta fuerza en la actualidad.
La cuestión central de la evaluación no es la emisión de juicios de valor sino los hechos que son juzgados. El problema viene cuando se plantea que no hay una verdad objetiva y la realidad es cuestión de preferencias. La adopción y extensión en el mundo occidental de una doctrina relativista que se resiste a reconocer la existencia de valores objetivos acompañó el nacimiento de las ciencias sociales, que lastran desde entonces las consecuencias de esa adopción. Hoy en día el relativismo está extendido en la forma de pensar de mucha gente y estrecha enormemente las posibilidades de las ciencias sociales. Si no hay conclusiones morales relativas a valores objetivos, no hay conclusiones evaluativas y es difícil establecer legitimidad en la toma de decisiones.
La ética, un sistema de valores, es la fundamentación necesaria del campo profesional de la evaluación. La evaluación es una cuestión de valores. Necesitamos hacer confluir los hechos con valores objetivos para resolver cuestiones reales e importantes, y la tendencia en las últimas décadas ha sido la de separlos en una especie de esquizofrenia colectiva. El relativismo no es la respuesta a los problemas de la sociedad. Es posible que encontremos muchos grises a la hora de establecer los valores, pero ese no es un problema insalvable sino un problema en el que hay que trabajar, pues en muchos casos puede darse una respuesta a la pregunta de cómo deberíamos valorar un hecho concreto. La primera respuesta sería acudir al valor del mercado, pero estamos hablando de encontrar algo más que un valor monetario. El evaluador busca el valor objetivo y verdadero de algo en el contexto de unas necesidades concretas; valores objetivos y contextualizados de lo que estemos evaluando teniendo en cuenta especialmente a la gente que interactúa con nuestro objeto de evaluación.

En este contexto, las teorías del valor estudian la naturaleza y justificación de los valores, cómo y por qué se contruyen los juicios de valor, y describen los valores y la posible supremacía de unos valores sobre otros. En un terreno más práctico, las teorías del valor definen cuatro pasos lógicos (llamada también lógica de evaluación) para la construcción de un juicio (Fournier, 1995; Scriven, 1995):

  1. El primer paso es definir los criterios sobre los que se ha de centrar la evaluación. Los criterios son propiedades esencialmente relacionadas con el objeto a evaluar y que determinan su bondad, valor e importancia. Se trata de aquellas condiciones que deben cumplir las intervenciones y que por tanto son el objetivo de las actividades de evaluación. El camino para una buena evaluación es el camino de los criterios, no de los indicadores, pues los indicadores son variables empíricas estadísticamente conectadas con los criterios, pero frecuentemente inestables en su validez, y en ocasiones fácilmente manipulables.
  2. El segundo paso consiste es establecer los estándares, es decir, los niveles de cumplimiento, específicos y medibles, que se exigen sobre un criterio. Este paso es el más difícil y para realizarlo puede acudirse a estándares de comparación (benchmarking) comparando nuestro objeto de evaluación con otro que consideramos adecuado.
  3. En el tercer paso se mide la actuación en cada uno de los criterios definidos y se compara con sus respectivos estándares. Esto dará idea del grado de cumplimiento alcanzado por la intervención.
  4. Finalmente se sintetiza la información en un juicio sobre el mérito, valor o importancia de la intervención en relación con los criterios y estándares definidos.

Referencias citadas:
Fournier, D. M. (1995). Establishing evaluative conclusions: A distinction between general and working logic. New Directions for Evaluation, 68, 15-32
Scriven, M. (1995). The logic of evaluation and evaluation practice. New Directions for Evaluation, 68, 49-70

 

Lógica de intervención: articulando control, seguimiento y evaluación

La siguiente figura visualiza cómo se puede plantear la articulación entre el control, seguimiento y la evaluación: el control se queda en los medios, el seguimiento alcanza las realizaciones materiales y parte de los resultados, mientras que la evaluación profundiza hasta los impactos a largo plazo.

Articulación entre el control, seguimiento y evaluación en términos de resultados e impactos

Articulación entre el control, seguimiento y evaluación en términos de resultados e impactos.

 

En términos de contenido de la evaluación, ésta deberá articularse de forma coherente a la estructura de los programas, haciendo corresponder a cada ámbito del programa (necesidades, objetivos, medios, realizaciones, resultados e impactos) unos criterios de evaluación específicos. La siguiente figura esquematiza las relaciones que se pueden establecer para juzgar el valor de un programa, lo que se ha venido llamando lógica de intervención o modelo lógico.

Intervención lógica de un programa

Intervención lógica de un programa.

 

Esta lógica de la programación tiene una gran incidencia en el seguimiento y la evaluación. La propia programación de las intervenciones se realiza a partir de un cierto número de hipótesis que permiten esperar que las acciones planificadas vayan a producir determinados resultados y generar determinado tipo de impactos. Así, las intervenciones se programan:

 

  • En un contexto determinado y atendiendo a unos objetivos globales (marcan los impactos a largo plazo esperados) que ofrece la perspectiva básica desde la que deberán implementarse las intervenciones.
  • Estos objetivos globales suponen la consecución de una serie de objetivos específicos (marcan los resultados esperados) que permiten precisar la naturaleza y características de las intervenciones a realizar.
  • La ejecución de estas intervenciones implica la realización concreta de un cierto número de acciones que, a su vez, van a producir una serie de realizaciones que deben permitir alcanzar los objetivos operativos programados.

 

El objetivo básico que se asigna al sistema de seguimiento de los programas consiste en verificar con regularidad su realización progresiva y efectiva, tanto física como financiera, así como las realizaciones y parte de los resultados respecto a los objetivos prefijados. Como refuerzo al sistema de seguimiento las evaluaciones deben aportar un juicio crítico sobre los impactos obtenidos y contribuir, con regularidad, a una gestión eficaz. De esta forma, el seguimiento del programa sigue la lógica esquematizada:

 

  • Las acciones realizadas, consumidoras de una cantidad determinada de recursos (medios), dan lugar a unas realizaciones que han de juzgarse en base a los objetivos operativos.
  • Las realizaciones dan lugar a unos resultados que deben contrastarse con los objetivos específicos prefijados.
  • Estos resultados dan lugar a la generación de un impacto global que es el que debe compararse con los objetivos globales con ayuda de la evaluación.

 

A la hora de evaluar los impactos generados por el programa conviene tener presente que éstos no son ni mecánicos ni automáticos y pueden haberse visto afectados por factores de incidencia externos al propio programa. En este sentido, se apunta el interés de comprobar con el sistema de seguimiento las relaciones de causalidad (indicadores) entre las acciones y los resultados, así como entre los resultados y los impactos.

 

De esta forma, en sentido descendente, los objetivos específicos de un nivel deben servir como marco de referencia global para la intervención en el nivel inferior y constituyen su objetivo básico, mientras que los resultados esperados de un determinado nivel constituyen los objetivos específicos que han de alcanzarse con la intervención en el nivel inferior.

 

A la inversa, en sentido ascendente, los objetivos específicos de un nivel constituyen los resultados que se espera conseguir en el nivel superior y, del mismo modo, el objetivo global de un nivel es contribuir a la consecución del objetivo específico del nivel superior.

 

La aplicación de la lógica de intervención no es sencilla y debe realizarse caso a caso, teniendo en cuenta los recursos movilizados y la propia complejidad de las intervenciones.

 

Además de articular el seguimiento y la evaluación ayudándose de la lógica de intervención, es importante articular los distintos ejercicios de evaluación de un programa: las evaluaciones previa, intermedia y final. A las evaluaciones intermedias, debido al momento de su realización, se les asigna una influencia directa en la configuración de los programas para lo cual deben ayudar a la identificación de sus deficiencias y presentar recomendaciones que favorezcan su mejora y/o modificación.

 

Las evaluaciones intermedias quedan así estrechamente relacionadas, por un lado, con las evaluaciones previas (con el objeto de determinar si los objetivos fijados en la fase de planificación se están alcanzando) y, por otro lado, con las evaluaciones finales/posteriores (con el objeto de incluir las disposiciones necesarias para la medición resultado final). Cuando estas relaciones son débiles, bien por la falta de un nivel de precisión adecuado en la definición y cuantificación de los objetivos en las evaluaciones previas, bien por deficiencias en el propio sistema de seguimiento, tanto las evaluaciones intermedias como las finales/posteriores se resienten y no llegan a cumplir plenamente su función.

 

Integración entre los programas y sus evaluaciones en las diferentes fases de aplicación

Integración entre los programas y sus evaluaciones en las diferentes fases de aplicación.

 

En la figura se refleja la interacción entre un programa y su evaluación en las diferentes fases de aplicación. Las flechas de línea discontinua indican que en la evaluación se obtiene y procesa información sobre los resultados y el impacto del programa aplicado. Las flechas de línea continua indican el momento de la evaluación y como las conclusiones y recomendaciones de esa evaluación deben incidir en el programa y en su aplicación o en las medidas que den continuidad al mismo. El esquema indica también que la evaluación debe aprovechar los resultados de evaluaciones anteriores (flechas superiores), es decir, que la evaluación intermedia debe tener presentes los resultados de la previa, y la evaluación final las conclusiones de la evaluación intermedia.

 

Relación entre seguimiento y evaluación

El seguimiento y la evaluación están íntimamente vinculados. Ambos constituyen instrumentos necesarios para aportar elementos de juicio al proceso de toma de decisiones y demostrar la rendición de cuentas. Ninguno de los dos reemplaza al otro. La evaluación aprovecha la base de datos creada durante el proceso de seguimiento, suplementándola según sea necesario con datos sobre el efecto causado por el programa y repasando la información combinada en el curso de un período prolongado a fin de juzgar lo realizado.

Funciones de seguimiento

 

Las funciones de seguimiento y evaluación de un programa de desarrollo. Fuente: Elaboración propia.

 

Las características y diferencias de una y otra actividad se definen en la siguiente tabla:

 

Características y diferencias entre seguimiento y evaluación

Seguimiento

Evaluación

Continuo Periódica, en etapas importantes: a mitad del período de implementación del programa, al final o al cabo de un período sustancial después de finalizado el programa
Análisis poco profundo, supervisa, analiza y documenta los progresos registrados Análisis a fondo; compara la planificación con los logros reales
Se centra en el seguimiento del beneficiario y en las realizaciones físicas y financieras Se centra en el análisis del planteamiento y lógica de intervención, aplicación y gestión, y en el impacto
Responde qué actividades se realizaron y qué resultados se obtuvieron Responde por qué y cómo se obtuvieron los resultados al contar con una mayor profundidad en el análisis.
Alerta a los administradores acerca de los problemas y brinda opciones para la adopción de medidas correctivas Brinda a los administradores opciones de estrategia y de política
Análisis interno (autoevaluación) de los gestores y los interesados locales Análisis externo a cargo de los evaluadores externos
Consumo interno del que se benefician los gestores y los interesados locales de la intervención Consumo interno y externo del que se benefician los gestores, los interesados locales y los encargados del control externo de la intervención

 

El seguimiento debe ser integrado a la estructura de gestión del programa, pero la evaluación, con sus horizontes más amplios, no es necesariamente un componente tan integral. Debemos considerar el seguimiento y la evaluación como funciones independientes una de la otra. Se encuentran separadas por sus objetivos, períodos de referencia, necesidades de análisis y usuarios. Pero una vez destacadas las diferencias, es necesario hacer constatar que hay características comunes que realzan la relación existente entre las dos actividades.

El seguimiento del programa y la evaluación deben colaborar con objeto de utilizar los recursos de manera eficiente sin perder de vista la finalidad primaria de acopiar recursos para información interna del programa, esto es, el suministro de un sistema de información diseñado para satisfacer las necesidades de gestión del programa.

Relación entre las funciones de seguimiento y evaluación

Relación entre las funciones de seguimiento y evaluación

 

Conceptos relacionados con la evaluación: seguimiento, control, auditoría, investigación

Al no haber unidad de criterio al definir el seguimiento y la evaluación se produce una cierta confusión semántica por lo que trataré de llegar a unas definiciones adecuadas dentro del campo del desarrollo (U.N., 1984; Casley & Kumar, 1990; FAO, 1999; Comisión de la UE, 1999; 2002).

Lo más práctico es comprender el uso de los términos de seguimiento y evaluación, advirtiendo la relación existente entre ellos y las distinciones que cabe establecer. Esta distinción depende del uso y significado que se haga de ellos. En Norteamérica el seguimiento es conocido como la gestión de sistemas de información (management information systems), dejando claro que el propósito de ambas actividades es más para la gestión que para la evaluación (Patton, 1997).

Por seguimiento podemos entender la valoración continua tanto del funcionamiento de las actividades del programa en el contexto de los calendarios de ejecución como de la utilización de los insumos del programa por parte de las poblaciones fijadas como objetivo en el contexto de las expectativas del diseño. Un examen exhaustivo y periódico de los recursos, productos (outputs) y resultados de las intervenciones.

El seguimiento es parte integral del día a día de la gestión. Responsabilidad de los gestores encargados de la implantación de una intervención. El seguimiento es una actividad interna del programa (evaluación interna) realizada por los propios gestores del programa, parte esencial de una buena práctica de gestión y, por tanto, parte integral de la gestión diaria.

Esto supone que gran parte de la labor de vigilancia será realizada por los propios gestores de programa, con la ventaja de asegurar una retroalimentación óptima de las enseñanzas adquiridas, pero puede adolecer de una falta de independencia. Esta última deficiencia puede subsanarse, al menos en parte, mediante unas normas rigurosas de planificación que exijan una clara indicación de los criterios de efectividad y de las metas que han de alcanzarse, y el establecimiento de las metodologías ordinarias de examen y evaluación que han de aplicarse.

Se distinguen en el seguimiento dos tareas fundamentales, por un lado la elaboración de un sistema de información, y por otro, la valoración continua de la marcha del programa que llamaremos autoevaluación (self-evaluation), de consumo interno y basada en el sistema de información.

El seguimiento se basa en un sistema de información coherente que incluye informes, estudios, balances, indicadores, etc. Ese sistema comprende los registros básicos físicos y financieros, los detalles de insumos y servicios suministrados a beneficiarios y los datos obtenidos de encuestas y otros mecanismos de registro, diseñados específicamente para atender a la función de seguimiento. Sin embargo, la evaluación, por lo común lleva consigo el establecer comparaciones que requieren información procedente externa al programa, en tiempo, zona o población.

La autoevaluación puede definirse como un proceso sistemático de valoración continua (evaluación sobre la marcha) de la pertinencia, eficiencia y eficacia de un programa durante su ejecución, realizado por los gestores de una intervención. La autoevaluación debe ser un ejercicio de reflexión interna de carácter voluntario dirigido a facilitar el aprendizaje. La autoevaluación trata de ejercicios sencillos encaminados a poner el acento en las recomendaciones prácticas que permitan el aprendizaje social y posibles cambios de rumbo en los programas.

La autoevaluación y el sistema de información deben estar diseñados uno en función del otro de manera que en el sistema de información se incluyen casi todos los campos cubiertos por la autoevaluación. En muchas ocasiones la línea divisoria entre ambos resulta muy tenue y no es posible decir dónde se detiene uno y comienza el otro. Cualquier diferencia entre estas dos actividades es meramente de énfasis. El sistema de información tiende a enfocarse más a las cuestiones de ejecución del programa, en tanto que la autoevaluación aborda los resultados probables de las intervenciones. Y en general puede decirse que el sistema de información alimenta la autoevaluación y posibilita la elaboración de recomendaciones prácticas, cuya verificación y uso permitan la mejora de la intervención.

sistema de informacion

 

De acuerdo con esta visión, las descripciones individuales de seguimiento del contacto con el beneficiario, de las realizaciones físicas y financieras y la evaluación interna en conjunto constituyen lo que se ha venido llamando seguimiento del programa. En definitiva podemos definir el seguimiento como: La actividad interna de una intervención, realizada por los propios gestores como parte integral de la gestión diaria, que realiza una valoración continua del contacto con los beneficiarios y de las realizaciones de la intervención sobre la base de un sistema de información y autoevaluación y dirigida a facilitar el aprendizaje, el fortalecimiento, adquisición de capacidades y la mejora continua.

La evaluación se distingue de otros procedimientos más normativos, tales como el control, la auditoría (audit) financiera o de gestión, que están encaminados a verificar, ya sea la regularidad, ya sea la legalidad o la ortodoxia financiera, o incluso a detectar errores, fallos o vicios de procedimiento. La principal distinción con la evaluación está por tanto en el objetivo y centro de atención, que en el caso de la evaluación es la valoración del mérito, valor e importancia. En otros términos, la evaluación no debe ser una herramienta de legitimación o deslegitimación de la ayuda, sino un mecanismo de aprendizaje que retroalimente información hacia quienes toman las decisiones. Otra distinción es quién realiza cada actividad: el seguimiento la realizan los gestores de una intervención, la evaluación evaluadores externos que se contratan, y el control y auditoría típicamente está relacionada con los organismos públicos de control.

 

Por último la evaluación se distingue de la investigación también en su objetivo: mientras que la investigación busca demostrar aspectos de la realidad con evidencias científicas, la evaluación busca mejorar esa realidad a través de juicios de valor en los que se pueda apoyar la toma de decisiones. La investigación busca en primera instancia aumentar el conocimiento (generalizable) en un determinado campo del saber mientras que la evaluación busca ayudar a la toma de decisiones y servir a propósitos específicos de las partes interesadas afectadas por lo que se está evaluando. Esas partes interesadas son las que en gran medida marcan la agenda de la evaluación, mientras que la agenda de la investigación la suele marcar el investigador que la realiza. La motivación por tanto también suele tener un enfoque distinto: curiosidad e interés científico en el caso de la investigación, y solucionar un problema concreto en el caso de la evaluación.

 

Referencias citadas (Puedes conseguir un ejemplar pinchando en los enlaces):

 

CASLEY, D. J. & KUMAR, K. (1990). Seguimiento y evaluación de proyectos en agricultura. Banco Mundial. Madrid: Mundi Prensa.

COMISIÓN DE LA UNIÓN EUROPEA (1999). The MEANS collection: Evaluating socio-economic programes. From the programme entitled MEANS: Means for Evaluating Actions of a Structural Nature. Directorate General XVI for Regional Policy and Cohesion. Office for Official Publications of the European Communities. Luxembourg.

COMISIÓN DE LA UNIÓN EUROPEA (2002). Project Cycle Management Handbook. Evaluation Unit of the EuropeAid Co-operation Office. March 2002. Version 2.0. Freiburg, Germany.

FAO (1999). Evaluación en el contexto del Marco Estratégico y del nuevo modelo de programación. Organización de las Naciones Unidas para la Agricultura y la Alimentación. Roma.

PATTON, M. Q. (1997). Utilization-Focused Evaluation: The New Century Text (3ª Ed.). Thousand Oaks: Sage Publications.

 

U.N. (1984). Guiding principles for the design and use of monitoring and evaluation in rural development projects and programmes. ACC Task Force on Rural Development. Panel on monitoring and evaluation. United Nations. Roma.

 

Buscando una definición de evaluación

La evaluación no debe ser vista ante todo como una actividad técnica o metodológica. Tampoco ha de ser entendida como la elaboración de informes. Es una actividad que principalmente implica pensar. La evaluación es en su sentido más profundo una vía para reflexionar sobre lo que está pasando. Muy íntimamente unida a esta apertura de un ámbito para reflexión, está el potencial de la evaluación para hacer repensar y analizar, generar capacidades entre la población afectada por un proceso de evaluación, y la mejora de las intervenciones que modifican la realidad que les rodea.

La evaluación como práctica profesional se ha venido definiendo como “el proceso de determinar el mérito, interés e importancia de las cosas” (Scriven, 2005, p. 235). Pero veamos cada uno de estos tres términos.

El mérito (merit) está relacionado con las propiedades intrínsecas, características o atributos de lo que estamos evaluando en comparación con los criterios de calidad utilizados. Por ejemplo, en el caso de una manzana estaríamos hablando de su sabor, apariencia, color, estado de madurez… En la evaluación de programas decimos que un programa tiene mérito cuando: 1) cumple con lo que estaba llamado a hacer, logrando los resultados esperados, y 2) supone una diferencia significativa en la realidad como consecuencia de su implementación.

manzana
El interés (worth) es la estimación de lo que vale lo que estamos evaluando en comparación o equivalencia a otra cosa, típicamente el dinero. Así que mientras el mérito puede ser difícil de medir, el valor suele expresarse en un valor monetario fácilmente medible. En el caso de la manzana estaríamos hablando de su precio. En el caso de la evaluación de programas podemos estar hablando de la comparación de dos programas (uno más barato que otro y por tanto con más valor) o la comparación de un mismo programa en dos sitios distintos (uno con más impacto que otro y por tanto con más valor).

mercado manzanas

La importancia (significance) se refiere a los valores y significación que asociamos a aquello que estamos evaluando. Es preguntarse por lo que lo hace especial o significativo para unos individuos concretos. En el caso de la manzana podríamos estar hablando de su importancia por quién me la ha regalado o por el hecho de que es lo único que tengo para comer; su mérito y valor pueden ser pequeños pero su importancia mucha. En el caso de la evaluación de programas podemos hablar de programa ineficaces, con impacto muy limitado, pero con una alta importancia por su valor simbólico por ser el único que cubre una determinada necesidad de un sector vulnerable de la población.

manzana2

La evaluación supone así la emisión de un juicio por parte de un sujeto sobre el mérito derivado de las características intrínsecas de lo que evaluamos, el interés en referencia a una determinada moneda (u otro referente que se considere adecuado) y la importancia en relación a características adheridas por el contexto y las personas que rodean lo que evaluamos. Pero es fundamental que ese juicio sobre el mérito, interés e importancia que se emite se fundamente en hechos objetivos y concretos. La evaluación es una actividad en la que partiendo de los hechos (objetivos) llegamos a un juicio (realizado por un sujeto) sobre esos hechos. Este juicio es subjetivo por naturaleza, pero deberá tratar de aproximarse a la realidad y objetividad de los hechos lo máximo posible.

En la evaluación de programas, podemos decir que una evaluación es una valoración, tan sistemática y objetiva como sea posible, de un proyecto, programa o política en marcha o terminado, su diseño, aplicación y resultados (Comisión de la UE, 2002). Evaluar una acción, una operación, un proyecto, un programa, significa examinarlo en su contexto de aplicación, para poder apreciar los efectos en relación con una situación de referencia, y juzgar su impacto en relación con los objetivos perseguidos: impacto global, utilidad social, interés económico… En este sentido, la evaluación es una valoración periódica del programa en el contexto de sus objetivos declarados (Casley & Kumar, 1990).

Una evaluación debe proporcionar unas informaciones creíbles y útiles, que permitan integrar las enseñanzas sacadas en la toma de decisiones. Para ello es importante preservar la independencia y objetividad de los evaluadores con respecto a los gestores y autoridades financieras, y que la evaluación constituya una actividad externa del programa realizada por profesionales ajenos a la gestión y control del programa.

La evaluación aplicada a un programa de desarrollo, examina de que manera el programa, y las diversas operaciones que lo integran, aporta soluciones a los problemas identificados, alcanza los objetivos fijados, crea nuevos valores económicos, sociales y culturales, así como las condiciones de una dinámica sostenible de desarrollo. En definitiva podemos intentar definir la evaluación de programas como: La actividad externa de una intervención, tan sistemática y objetiva como sea posible, que lleva a cabo de forma periódica el análisis y valoración a fondo de la intervención o aspectos concretos de ella, su diseño, aplicación y resultados, con referencia a unos criterios y estándares explícitos; lo que lleva a un juicio de valor sobre el mérito, interés e importancia y a una oportunidad para el aprendizaje y mejora continua de la intervención y la toma de decisiones sobre futuras intervenciones.

Referencias citadas:

CASLEY, D. J. & KUMAR, K. (1990). Seguimiento y evaluación de proyectos en agricultura. Banco Mundial. Madrid: Mundi Prensa.

COMISIÓN DE LA UNIÓN EUROPEA (2002). Project Cycle Management Handbook. Evaluation Unit of the EuropeAid Co-operation Office. March 2002. Version 2.0. Freiburg, Germany.

SCRIVEN, M. (2005). Logic of evaluation. In S. Mathison (Ed.), Encyclopedia of evaluation (pp. 235-238). Thousand Oaks, CA: Sage.