Agronomía Tropical  > Colección  >  Sumario Volumen 44   >  Articulo


Agronomía Tropical. 44(3): 475-497.1994

USO DEL METODO DE ANALISIS DE COMPONENTES PRINCIPALES PARA LA CARACTERIZACION DE FINCAS AGROPECUARIAS

J. R. Demey* ; M. Adams* ; H. Freites*


*
Profesores de la Universidad Central de Venezuela. Facultad de Agronomía. 
Apdo. 4579. Maracay 2101. Venezuela.

RECIBIDO: agosto 25, 1992


RESUMEN

En el presente trabajo se aborda el análisis, interpretación y clasificación de los sistemas de producción agrícola a través del uso del método de análisis por componentes principales (ACP), utilizando como caso particular el sistema de producción de arroz Sistema de Riego Río Guárico, (SRRG), Venezuela. Mediante el ACP se seleccionaron los primeros siete componentes que explicaban el 58.99% de la variación total. Esto permitió una clasificación en cuatro estratos, discriminando las fincas de buen, mediano, regular y mal manejo en el cultivo del arroz en el SRRG. No se encontró un modelo de finca exitosa dentro del sistema. Se detectó que los factores de mayor incidencia en la producción arrocera del SRRG fueron: dimensión, tamaño o escala de la finca, fuentes y dosis de fertilización y tipo de riego.

Palabras Claves: Oriza sativa, explotación agrícola, fertilización, riego.

INTRODUCCION

El estudio de sistemas es una valiosa herramienta para describir la diversidad de todos los elementos o variables que interactúan o son independientes en la continuidad de una totalidad organizada. Determinar si alguna variable que forme parte del sistema es independiente o no, no es tarea sencilla, estas variables que aparentan independencia, en realidad tienen sus autorregulaciones significativas y responden a estímulos del medio externo, esto obliga a concebir los sistemas como un conjunto armónico y coherente donde cada variable de acuerdo con sus salidas y entradas en las interrelaciones con el medio, la ubican en una jerarquía o nivel de importancia (CLOUET, 1983 y FREITES, 1991).

El objetivo de este trabajo es analizar, interpretar y clasificar los sistemas de producción agrícola a través del uso del método de análisis de componentes principales (ACP), del sistema de producción de arroz Sistema de Riego Río Guárico (SRRG) determinando las relaciones entre las variables técnicas, socioeconómicas, agroecológicas e institucionales. Así mismo, se describirá el sistema de producción, identificando las variables estratégicas o determinantes, las interacciones más importantes y el efecto ponderado en el modelo generalizado del sistema con el fin de generar subgrupos homogéneos.

ARIAS, et al., (1981) definen al sistema como la forma y nivel como se organizan los factores de la producción (tierra-capital-trabajo), en función de una intencionalidad del productor, quién en acción, e insertándose en unas determinadas relaciones sociales y técnicas de producción, obtiene ciertos productos o rubros. Todo ello dentro de un mismo o similar ámbito agroecológico (aspectos principalmente endógenos o interrelacionados con otros conjuntos de su misma naturaleza) ubicados y relacionados dentro de una microregión, región y país.

El ACP permite comprender mejor la estructura de correlación existente entre las variables que definen un sistema de producción y establecer hipótesis sobre la interrelación existente entre las mismas (CHATFIELD y COLLINS, 1980).

PLA (1986) define al ACP como una técnica matemática que no requiere un modelo estadístico para aplicar la estructura probabilística de los errores. Sin embargo, si puede suponerse que la población muestreada tiene distribución multinormal, podrá estudiarse la significación estadística y será posible utilizar la muestra efectivamente observada para realizar pruebas de hipótesis que contribuyan a conocer la estructura de la población original con un cierto grado de confiabilidad, fijado a priori o a posteriori.

El ACP es un método esencialmente descriptivo, por lo tanto, según sean los objetivos particulares del estudio que se realiza, el ACP podrá ser suficiente para alcanzar el objetivo, o no representar más que una primera aproximación -por supuesto indispensable-, pero preliminar, para el empleo de otros métodos estadísticos (PHILIPPEAU, 1990). CHRISTOPHERSEN y HOOPER (1992) señalan que el uso del ACP es el primer paso en el análisis de factores y es menos dependiente de las decisiones subjetivas, a diferencia de otros métodos.

El propósito del ACP es encontrar "espacios de dimensiones más pequeñas" en los cuales sea posible observar a los individuos de la "mejor manera". Los espacios escogidos tendrán una dimensión, es decir rectas o dos dimensiones (caso más frecuente), es decir, planos (CHATFIELD y COLLINS, 1980; MORRISON, 1976; PHILIPPEAU, 1990 y PLA, 1986).

Estas nuevas variables o componentes principales resumen en pocas dimensiones la mayor parte de la variabilidad de un gran número de variables. Los componentes principales sucesivos corresponden a porcentajes cada vez menores de la varianza total y el problema consiste en determinar cuantos componentes pueden ser interpretados (CHATFIELD y COLLINS, 1980; PLA, 1986 y PHILIPPEAU, 1990).

El análisis por componentes principales deberá ser aplicado cuando se desee conocer la relación entre los elementos de una población y se sospeche que en dicha relación influye de manera desconocida un conjunto de variables o propiedades de los elementos (PLA, 1986).

Desde sus orígenes, el ACP tiene aplicación a ciertas tareas de diagnóstico o predicción y es una poderosa técnica multivariada que puede ser aplicada a un sin número de problemas en las ciencias. De este modo, el método ACP ha sido utilizado por climatólogos y meteorólogos para la delineación de patrones de temperatura, presión, precipitación, etc. (RICHMAN, 1981; LEGATES, 1991; BRIER y MELTESEN, 1976; DAVIS et al., 1991); en investigaciones de clasificación de áreas homogéneas de suelos (OVALLES y COLLINS, 1988; KOSAKI y JUO, 1989 y NASH y DAUGHERTY, 1990); en estudios con insectos (SHARMA, 1988); en tecnología de alimentos (POWERS, 1988 y RESURRECCION, 1988); en análisis atmosféricos (BARNETT, 1977 y KUTZBACH, 1967); zoología (THORPE, 1988); geofísica (REDMOND y KOCH, 1991); botánica (ARIYO y ODULAJA, 1991), horticultura (HOBSON et al, 1990 y IEZZONI y PRITTS, 1991); fitopatología (SHUH et al., 1987); ecología (PLA, 1982; MORIN et al., 1989; HERMY y PAUL, 1991); genética (FUNDORA et al., 1988); en clasificación de sistemas de producción de leche (QUEVEDO, 1991).

Al estudiar un conjunto de n individuos mediante p-variables es posible encontrar nuevas variables denominadas Y(k), k=1,...,p que sean combinaciones lineales de las variables originales X(j), e imponer a este sistema ciertas condiciones que permitan satisfacer los objetivos del análisis por componentes principales. PLA (1986) señala, que esto implica encontrar (pxp) constantes tales que:

k = 1, . . , p

donde l(jk) es cada una de esas constantes. Obsérvese que debido a la sumatoria, en cada nueva variable Y(k) intervienen todos los valores de las variables originales X(j). El valor numérico de l(jk) indicará el grado de contribución que cada variable original aporta a la nueva variable definida por la transformación lineal. Puede expresarse la tranformación lineal de componentes principales en términos matriciales: Y(nxp) = X(nxp) L(pxp).

El conjunto de ecuaciones representadas en Y, define la relación que hay entre los componentes principales y la matriz de varianza-covarianza ( en este caso la matriz S de varianza-covarianza estimada) o la matriz de Correlación R, dependiendo de cual vía se utilice para generar los componentes principales.

La generación de estas nuevas variables o componentes principales es susceptible a la escala en la cual esten medidas las variables originales. Por lo que se recomienda utilizar los datos centrados cuando todas las variables estén expresadas en las mismas unidades, es decir, hacer los cálculos vía matriz varianza-covarianza. Se utilizan datos centrados reducidos cuando la matriz de datos originales esté constituída por variables de naturaleza diferente o caracterizada por diferentes unidades, esto con el objetivo de no incurrir en interpretaciones erróneas debido a la diversidad de escala de medición. PLA (1986) señala que en algunos casos, al hacer los cálculos vía matriz varianza-covarianza, se obtiene que el primer componente explica casi toda la variabilidad, sin embargo, si no se ha previsto que en la matriz de datos originales exista heterogeneidad en las escalas de medición; cualquier interpretación que se haga puede ser no confiable.

Cada componente principal explica una proporción de la variabilidad total y esa proporción puede calcularse mediante el cociente entre el valor propio y la traza de S. Este cociente se denomina proporción de la variabilidad total explicada por el componente k-ésimo.

Dado que los valores propios representan la varianza de los componentes, cuando se ordenan en forma creciente se pueden seleccionar los primeros p como valores propios, siendo p <<k, y la eficiencia del ajuste de los datos originales, por los nuevos k componentes principales estará dada por la proporción de la variación total explicada por la suma de los k primeros valores propios (PLA, 1986).

PLA (1986) indica que decidir el número de componentes necesarios para que el porcentaje de variación explicada sea satisfactorio puede ser un inconveniente a la hora de pretender reducir la dimensionalidad del problema, puesto que no es posible aplicar una prueba de hipótesis que tenga validez para toda situación y que permita decidir cuándo se ha alcanzado el "nivel satisfactorio".

Un caso particularmente complejo se presenta cuando todos los componentes sintetizan proporciones similares de la variación total, y en consecuencia, es difícil decidir cuantos componentes deberán seleccionarse o si debe aceptarse que la verdadera dimensión del problema analizado es la original.

Existen diversos criterios que permiten tomar una decisión sobre el número de componentes a incluir (MARDIA et al., 1979, PLA, 1986): 1) Inspección de la correlación de los componentes principales con las variables originales; 2) inspección de la matriz S o R; 3) graficar el porcentaje de la variación explicada por cada componente en las coordenadas y los componentes en orden decreciente en las abscisas, método de las ondas, 4) incluir sólo aquellos cuyos valores propios sean superiores al promedio. Si se utiliza la matriz R, se incluirán los componentes cuyos valores propios sean mayores que 1, sin embargo, este criterio de acuerdo con Kaiser tiende a incluir muy pocos componentes cuando el número original de variables es inferior a 40 y 5) probar la hipótesis de que los últimos p-k valores propios son iguales. Esta prueba se conoce también como la prueba de isotropía ya que implica que en las últimas p-k dimensiones los datos están dispersos en una hiperesfera y, por lo tanto, el incluir uno de los componentes en el análisis debería implicar la inclusión de todos los restantes.

En los dos primeros componentes principales se sintetiza el mayor porcentaje de la variación total, es decir, es en estos dos vectores donde va a estar la mayor cantidad de criterios de clasificación debido a las variables originales. Esto permite clasificar a los individuos utilizando el gráfico donde se crucen los valores de los dos primeros componentes principales, pudiendo determinar los valores específicos que adopte cada individuo en particular. Esto se logra asignando a cada individuo un número de identificación. El gráfico permitirá separar a los grupos de individuos que tengan características diferentes y que tienen la mayor ponderación sobre los dos primeros componentes.

QUEVEDO (1991) señala que este método de clasificación tiene la ventaja de que se hace basándose en un conjunto amplio de criterios y no en una sola variable, además, se tiene mayor certeza respecto a cuales son en realidad los mejores individuos del grupo (si ese es el caso) y genera más de tres categorías o clases para el caso de clasificación de fincas. Esta ventaja es importante ya que otros métodos de clasificación comparativos sólo generan tres estratos. Realizada esta selección se calculan las características medias para cada grupo, pudiéndose luego utilizar las pruebas de hipótesis que fuesen necesarias.

Este método de clasificación es particularmente importante en trabajos donde se tomen en cuenta variables cuyo carácter de medición introduzca sesgo debido a la subjetividad del que da la respuesta y a otro tipo de situaciones particulares que intervengan en el sistema en estudio. En el caso de clasificación de fincas se incluyen variables de carácter económico o social, otros métodos de agrupación, por ejemplo el de conglomerados, introducen límites muy rígidos entre un grupo y otro. En el método de análisis de grupos, vía componentes principales está la separación más atenuada, semejando lo que sucede en la realidad.

La desventaja principal de este método es que a medida que se aleja del primer componente principal, el nivel de certeza de la clasificación va disminuyendo proporcionalmente a la contribución que tienen los componentes sucesivos a la explicación del porcentaje total de la variación.

MATERIALES Y METODOS

El presente estudio está referido a 529 fincas y parcelas dedicadas al cultivo del arroz en el SRRG y sus zonas de influencia comprendidas entre los ríos Guárico y Tiznados, constituyendo la totalidad de los productores de arroz del sistema. El instrumento seleccionado para recoger la información técnica, socioeconómica, agroecológica e institucional fue la encuesta, a través de la cual se recogió datos de 41 variables. La calidad de la información suministrada por los productores fue verificada en lo referente a superficie total de la finca, superficie sembrada, parque de maquinarias y equipo, a fin de garantizar su confiabilidad.

El SRRG está ubicado en la región central de Venezuela, en él se cultiva el 50% de la producción de arroz del país. El área es de 60 000 ha, aunque si son incluídas las zonas de influencia o marginales esta superficie se duplica. Sin embargo, la superficie regada por el sistema en la actualidad no supera las 23 000 ha (MAC, 1990), aún cuando se cuenta con una capacidad de almacenamiento mucho mayor que podría elevar la superficie regada en más de un 100%. Esto sugiere que otros factores que interactuan dentro del sistema de producción inhiben ese crecimiento.

La matriz de datos X está constituida por el conjunto de vectores de las observaciones X[ij], j=1,...,p y donde cada vector X[ij] presenta la variable j-ésima para todas las observaciones y donde X, es la matriz de datos formada por "n" observaciones con "p" variables (529 observaciones o fincas x 41 variables estudiadas).

Utilizando el paquete estadístico SAS versión 6.04 (1988a, 1988b), procedimiento PRINCOMP, se generaron los valores propios y proporción de la varianza explicada; la matriz de vectores propios de la matriz de transformación calculada vía matriz de correlación; la matriz de correlación entre las variables originales y los componentes principales; la proporción de la variación original explicada por cada componente principal de la matriz de correlación o matriz de determinación. El mismo programa genera el gráfico tipo XY entre el primer y segundo componente principal.

Para tomar una decisión sobre el número de componentes a incluir se utilizó el criterio de Kaiser, que incluye sólo aquellos cuyos valores propios son superiores al promedio. Como los componentes principales fueron generados vía matriz R, se tomaron en cuenta los componentes cuyos valores propios fueron mayores a 1 y el método gráfico basado en ondas, los cuales coinciden en sus resultados.

RESULTADOS Y DISCUSION

Análisis preliminar con la matriz de datos completos

El primer análisis con las 41 variables originales permitió eliminar aquellas que agregaban muy poco y sólo contribuían a distorsionar el análisis y hacer "ruido". Es así que se requerían 23 componentes para que la proporción de la varianza total explicada a partir de la matriz de correlación alcanzara el 80%, bastante elevado para explicar la caracterización del sistema, y además la proporción de la variación original explicada por cada componente principal no era mayor a un 32%. Igualmente la correlación de las variables originales con los dos primeros componentes no era de significación, presentando valores muy cercanos a cero.

El análisis preliminar permitió seleccionar las siguientes 24 variables: sector donde está ubicada la finca (X1); superficie total de la finca (ha) (X3); superficie cultivada de arroz (ha) (X4); variedad utilizada en la siembra (X8); rendimiento en kg/ha (X9); preparación del terreno (X10); fecha de siembra (X11), cómo se realiza la siembra (X12); fuente de nitrógeno (X13); dosis aplicada de nitrógeno (X14); fuente de fósforo (X15); dosis aplicada de fósforo (X16); fuente de potasio (X17); dosis aplicada de potasio (X18); forma de aplicación de N-P-K (X19); limitaciones por plagas (X22); limitaciones por enfermedades (X24); limitaciones por malezas (X26); tipo de aplicación de agroquímicos (X27), tipo de riego utilizado (X28); limitaciones: equipos y maquinarias (X29); limitaciones por cosechadora (X30); asistencia técnica (X34); tipo de mano de obra utilizada (X39); del total de 41, consideradas como representativas de los diversos aspectos que caracterizan la producción de arroz.

Análisis con la matriz de datos reducida

Utilizando el criterio de incluir sólo aquellos valores que fuesen mayores a 1, se seleccionaron siete componentes principales (Cuadro 1), los cuales explican el 58.99% de la variación, que no es una proporción significativa del total (<< 75%), ya que se pierde 41.01% de la varianza, pero se reduce la dimensión de la matriz en un 70.83%, con lo cual se simplifica conside-rablemente tanto la interpretación como el tratamiento posterior que haga de los mismos.

También puede observarse mediante el método gráfico que la primera "onda" incluye los primeros siete componentes y la segunda alcanza hasta el décimo tercer componente. La Figura 1 muestra la distribución de la varianza explicada entre los 24 componentes principales de los datos bajo análisis, coincidiendo este criterio de selección con el de Kaiser.

 

FIGURA 1. Variaciones explicada por los componentes vía matriz de correlación.
FIGURA 1. Variaciones explicada por los componentes vía matriz de correlación.

 

 

CUADRO 1. Valores propios y proporción de la varianza explicada calculada a partir de la matriz de correlación.


Componentes

Valor Propio

Proporción de la Varianza Total Explicada

Absoluta

Acumulada


1

5.98141

0.249226

0.24923

2

2.01365

0.083902

0.33313

3

1.51101

0.062959

0.39609

4

1.28012

0.053338

0.44942

5

1.17971

0.049154

0.49858

6

1.12616

0.046923

0.54550

7

1.06617

0.044424

0.58993

8

0.97593

0.040664

0.63059

9

0.91322

0.038051

0.66864

10

0.85341

0.035559

0.70420

11

0.83847

0.034936

0.73914

12

0.77152

0.032147

0.77128

13

0.76135

0.031723

0.80301

14

0.71068

0.029612

0.83262

15

0.67879

0.028283

0.86090

16

0.63156

0.026315

0.88721

17

0.50505

0.021044

0.90826

18

0.48020

0.020008

0.92827

19

0.42292

0.017622

0.94589

20

0.38066

0.015861

0.96175

21

0.35453

0.014772

0.97652

22

0.28080

0.011700

0.98822

23

0.18024

0.007510

0.99573

24

0.10245

0.004269

1.00000


De la matriz de transformación se obtuvo información sobre la mayor correlación posible entre las variables originales y los componentes principales; esta matriz sirvió de base para calcular los respectivos coeficientes de determinación o proporción de la variación explicada.

En el análisis de los componentes principales, tal vez la parte más delicada es la interpretación de estas nuevas variables transformadas, las cuales ya no tienen el mismo significado de las originales. Cada componente es el resultado de una combinación lineal de las variables en donde cada una tiene una ponderación diferente, en proporción a las magnitudes de cada elemento que conforma el autovector respectivo. Por consiguiente, el significado de cada componente dependerá de la magnitud de tales ponderaciones y de su signo a lo cual es necesario encontrarle sentido desde un punto de vista técnico (QUEVEDO, 1991).

Para determinar qué variables de cada uno de estos componentes seleccionados explican la variabilidad de este componente, se tomaron en cuenta solamente aquellos con un valor igual y superior a 35%.

El primer componente es el que tiene la varianza más alta y por lo tanto la mayor capacidad explicatoria de los datos. En este caso alcanza el 24.9% del total.

En este primer componente se observan valores positivos en proporciones más o menos análogas de aquellas variables que en su conjunto reflejan el tamaño, escala, dimensión o superficie de las fincas; superficie total de la finca (X3); superficie cultivada de las fincas (X4). Estos resultados se pueden interpretar como el de un componente cuyas magnitudes están asociadas con la discriminación entre fincas que tienen valores elevados de las variables mencionadas y las que no lo presentan. Como estas variables están vinculadas al concepto de tamaño, podría señalarse que los valores altos de este componente se encuentran vinculados a fincas grandes, y que este aspecto explica la cuarta parte de la variabilidad total. Podría destacarse entonces que las mayores superficies cultivadas están ubicadas en las fincas de gran tamaño. Esto indica además que estas fincas son las que determinan la capacidad de producción del sistema.

El segundo componente explica un 8.3% de la variabilidad total. Está referido a las fuentes de fertilizantes; fuentes de fósforo (X15; fuente de potasio (X17); y fuente de nitrógeno (X13).

La fuente de fertilizante parece referirse a la importancia o no de utilizar elementos puros o elementos compuestos. Esta actividad de prioridad parece indicar que el uso de elementos puros es un indicador de eficiencia en la producción de arroz del sistema.

Al efectuar las mezclas con los elementos puros el agricultor le está supliendo a la planta sólo la cantidad del elemento que necesita, lo que implica un ahorro de fertilizante y de costos de producción.

Si se asocia este componente al primero, podría indicar que las fincas de gran superficie hacen una mayor utilización de estos elementos, lo que quizas le permite una mayor superficie cultivada, o que las fincas de mayor tamaño y superficie cultivada hacen una mejor selección de los elementos de fertilización o una combinación efectiva de estos.

El tercer componente interpreta el 6.3% de la variabilidad total. Está referido a las dosis de fertilización; dosis de potasio (X18); dosis de fósforo (X16) y dosis de nitrógeno (X14), pero con valores negativos.

Estos valores negativos parecen indicar como premisa que las dosis de fertilizantes usadas en el sistema no son las adecuadas. Podría deducirse que no usan las dosis adecuadas ya sea por desconocimiento, o que existe el factor costo de los fertilizantes.

El cuarto componente. representa un 5.3% de la variabilidad total. Se presentan con valores positivos el tipo de riego utilizado (X28); y las limitaciones por malezas (X26).

Esto parece confirmar la alta capacidad de riego que tienen los productores del sistema y combinado al valor positivo de las limitaciones por malezas determina: que el riego es determinante en la producción de arroz del sistema y al mismo tiempo el tipo de riego utilizado (de la represa o bombas), define la superficie cultivada. Además, la capacidad de riego que permite inundar las zonas o sectores donde están ubicadas las fincas permite un mejor control de malezas. Es conocido que permite el batido o control mecánico de las malezas presentes en el arrozal, logrando así detener temporalmente el crecimiento de las malezas y su competencia con el cultivo del arroz.

Igualmente indicaría que el mejor control de malezas esta relacionado con las fincas y sectores con la mejor capacidad de riego.

El quinto componente comprende un 4.9% de la variabilidad total. Un valor negativo alto del tipo de mano de obra utilizada (X39) y un valor positivo promedio del tipo de aplicación de agroquímicos (X27).

Esto indicaría que el tipo de mano de obra incide negativa<+>mente en la producción de arroz, situación conocida; las limitaciones que se originan en la contratación o empleo de trabajadores agrícolas, ya sea porque, no existe en la zona mano de obra capacitada para efectuar las labores agrícolas o se presenta limitada, provoca insuficiencia de personal que trabaje este rubro.

El valor positivo para el tipo de aplicación de agroquímicos podría indicar que es determinante en la sobrevivencia del cultivo. Se asocia el valor negativo de la mano de obra utilizada con la aplicación de agroquímico. Se diría que los primeros no intervienen en su aplicación y que el tipo de aplicación es mayoritariamente aérea y mecánica.

El sexto componente representa un 4.7% de la variabilidad total. Tienen valores positivos la preparación del terreno (X10) y las limitaciones por enfermedades (X24).

El perfil corresponde a la alta mecanización que existe en la producción de arroz del sistema, lo cual estaría revelando, por una parte, que el parque de maquinaria agrícola aparentemente satisface las necesidades de los productores, así como la importancia que tiene para los productores la preparación de una buena cama de siembra; por la otra, indica que la mecanización tiene un peso considerable en los costos de producción por hectárea del cultivo del arroz.

El valor positivo de las limitaciones por enfermedades estaría indicando que existe un buen control o prevención de los ataques de los patógenos en el sistema.

Combinando estas dos variables con valores positivos se podría decir que con la buena preparación de terreno se están creando las condiciones para una "buena cama" de siembra, y al mismo tiempo están destruyendo los hospederos que servirían de refugios a los vectores donde se alojan los patógenos, y que debido a estas labores habría una buena prevención de enfermedades.

El séptimo componente comprende un 4.4% de la variabilidad total. Está representado por valores positivos, el rendimiento en kilogramos (X0); cómo se realiza la siembra (X12); y con valor negativo las limitaciones por maleza (X26).

Este resultado indicaría que el rendimiento en kilogramos en la producción de arroz es satisfactorio, tomando en cuenta que este valor está sometido a la veracidad de la fuente, que en este caso fueron los mismos productores.

El valor positivo de cómo se realiza la siembra revelaría que el valor positivo se realiza de forma manual y aérea pre-germinada y que no presenta limitaciones en la producción del sistema. El valor negativo del control de malezas asociándolo a las variables anteriores, indicaría que la presencia de las malezas afectaría el rendimiento en la producción actual, la cual puede limitarse quizás con la forma de efectuar la siembra.

Los componentes en relación a su importancia y significación se resumen tal como se presentan en el Cuadro 2.

Del análisis de la matriz de correlación entre las variables originales y los componentes principales, puede notarse que los valores más altos del componente uno son, justamente, los mismos que se encontraron al realizar la revisión de la matriz anterior, con lo cual se logra una nueva precisión en relación a la importancia relativa de las variables asociadas a cada componente. Los resultados de la revisión de la matriz correlación entre las variables originales y los componentes principales se presentan a continuación:

 

CUADRO. 2 Significado de los primeros siete componentes principales vía matriz de correlación (R).

Componente

Porcentaje de Explicación

Interpretación


Primero

24.90

Dimensión, escala o tamaño

Segundo

8.30

Fertilización fuente

Tercero

6.30

Fertilización dosis

Cuarto

5.30

Utilización del riego

Quinto

4.90

Mano de obra calificada

Sexto

4.70

Preparación del terreno

Séptimo

4.40

Rendimiento

Total varianza explicada

-

58.99%


En el primer componente explica el 75% de la superficie de la finca (X3), el 75% de la superficie cultivada (X4) y el 60% del sector donde está ubicada la finca; todas variables relacionadas con la dimensión de la finca.

En el segundo componente las variables más explicadas son la fuente de potasio (X15) con un 66%; fuente de fósforo (X17) con un 58% y la fuente de nitrógeno (X13) con un 36%; como se observa, todos se vinculan a la fuente de fertilizante usada en el sistema.

El tercer componente destaca la relación dosis de potasio (X18) con un 25%; dosis de fósforo (X16) con un 66% y dosis de nitrógeno (X14) con un 21%. Este resultado, que en el autovector tiene valores negativos, parece indicar mucha intensidad de uso, pues las variables de más varianza se asocian al alto uso del fertilizante.

El cuarto componente las variables de mayor ponderación son el tipo de riego utilizado (X28) con un 37% y limitaciones por malezas (X26) con un 31%. Se confirma así, con sus valores positivos, que las limitaciones con malezas se ven reducidas con la presencia del riego.

El quinto componente presenta el tipo de mano de obra utilizada (X39) con un 30% y el tipo de aplicación de agroquímicos (X27) con un 25%. Como se recordara, en el autovector el tipo de mano de obra utilizada tenía signo negativo, lo cual da una idea de la baja utilización de ésta en el sistema y de una alta mecanización en el tipo de aplicación del agroquímico.

El sexto componente revela que la variable mejor explicada es la preparación del terreno (X10) con un 30%. Confirma la alta mecanización en la producción de arroz en el sistema y complementa el concepto de la buena cama de siembra para el cultivo.

El séptimo componente destaca el rendimiento en kilogramos (X9) con un 22%. Hablando objetivamente podría concluirse que el rendimiento en kilogramos es satisfactorio, de manera general, en el sistema.

Puede observarse que a medida que se aleja del componente principal la proporción de la varianza, explicada por las variables más relevantes de los componentes, se va reduciendo considerablemente.

Este análisis confirma la conveniencia de no retener más allá del séptimo componente; se explica así el 58.99% de la variación y se simplifica considerablemente el modelo inicial al reducir la dimensión de la matriz en la tercera parte. Del mismo modo, se observa en el Cuadro 3 que la proporción total de la varianza de cada variable, que es explicada por los siete primeros componentes, es poco más que la media de la variabilidad total, alcanzando sólo el 58.99% de la misma.

En este caso vale considerar un balance entre la pérdida de capacidad explicatoria y el número de componentes que se eliminan en relación a la naturaleza técnica del problema bajo estudio. Si se aumenta el número de componentes hasta la segunda onda explicatoria lo elevamos a 13 componentes logrando así una capacidad explicatoria de un 80.30%, pero se trataría entonces de un modelo muy complejo para estimar y explicar, además de incluir autovalores inferiores al promedio (Figura 1).

 

CUADRO 3. Proporción de la variación original explicada por los siete componentes principales de la matriz de correlación.

Variable

C O M P O N E N T E S

-

1

2

3

4

5

6

7

Suma


Sector

0.60

0.02

0.07

0.01

0.00

0.00

0.01

0.71

X3

0.75

0.00

0.04

0.01

0.00

0.02

0.00

0.82

X4

0.75

0.00

0.04

0.00

0.00

0.01

0.00

0.80

X8

0.14

0.02

0.00

0.04

0.08

0.06

0.08

0.42

X9

0.07

0.01

0.00

0.01

0.09

0.01

0.22

0.41

X10

0.07

0.03

0.00

0.00

0.00

0.30

0.07

0.47

X11

0.49

0.01

0.02

0.01

0.00

0.01

0.00

0.54

X12

0.19

0.00

0.01

0.05

0.01

0.04

0.13

0.42

X13

0.26

0.36

0.01

0.00

0.01

0.05

0.00

0.69

X14

0.15

0.04

0.21

0.04

0.01

0.01

0.00

0.46

X15

0.06

0.66

0.03

0.02

0.04

0.02

0.01

0.84

X16

0.33

0.08

0.24

0.01

0.00

0.07

0.04

0.77

X17

0.06

0.58

0.04

0.00

0.01

0.00

0.01

0.70

X18

0.23

0.07

0.25

0.00

0.03

0.10

0.00

0.69

X19

0.45

0.00

0.07

0.00

0.02

0.01

0.01

0.56

X22

0.05

0.01

0.06

0.21

0.06

0.09

0.01

0.49

X24

0.17

0.00

0.10

0.00

0.03

0.14

0.06

0.50

X26

0.01

0.00

0.00

0.31

0.07

0.03

0.15

0.57

X27

0.00

0.09

0.01

0.09

0.25

0.00

0.08

0.52

X28

0.02

0.03

0.09

0.37

0.03

0.08

0.00

0.62

X29

0.57

0.00

0.04

0.00

0.00

0.01

0.00

0.62

X30

0.30

0.00

0.03

0.01

0.04

0.04

0.04

0.46

X34

0.22

0.01

0.08

0.00

0.11

0.00

0.00

0.42

X39

0.04

0.00

0.07

0.08

0.30

0.02

0.10

0.61


Con los resultados del Cuadro 3 se ordenan las variables en orden decreciente respecto al porcentaje de explicación que se logra con cada una de ellas, esto permite hacer un arreglo de la misma en relación a su importancia, puesto que aquellas que resultan explicadas en un porcentaje mayor son las que mayor peso tienen en la combinación lineal de los primeros siete componentes.

Los datos correspondientes a la nueva forma de agrupación de las fincas se presentan en la Figura 2, puede verse que el análisis discrimina cuatro categorías distintas de fincas o unidades de producción.

 

FIGURA 2. Representación bivariada de los resultados de las 529 fincas del SRRG con los dos primeros componentes.
FIGURA 2. Representación bivariada de los resultados de las 529 fincas del SRRG con los dos primeros componentes.
 

En el Cuadro 4 se presenta el porcentaje de fincas ubicadas en cada sector producto de la representación bibariada, donde cada finca está representada por el número de sector asignado.

CUADRO 4. Número de fincas agrupadas en los sectores y porcentaje de las mismas.


Grupo

Sector 1 Campesino

Sector 2
Mediano

Sector 3 Empresarial

Total

Porcentaje


A

254

60

5

319

60.30

B

22

2

3

27

5.10

C

9

19

69

97

18.33

D

10

18

58

86

16.25

Total Fincas

295

99

135

529

100.00


Con estos valores ya determinados se logra la composición del Cuadro 5, donde se agrupan las fincas de acuerdo con la clasificación obtenida producto de la interpretación de los componentes.

 

CUADRO 5. Clasificación de las 529 fincas productoras de arroz basada en los dos primeros componentes principales.


Grupo

Características

Porcentaje


A

Fincas de poco tamaño, escala o superficie, y baja superficie en cultivo, sin facilidades en la finca, sin maquinaria agrícola, sin selección de la fuente y dosis del fertilizante, sin asistencia técnica.

60.32

B

Fincas de mediano tamaño y mediana superficie cultivada, con regular selección de la fuente utilizada de fertilizante, escasas facilidades en la finca y de maquinaria agrícola, poca asistencia técnica, limitaciones por cosechadora, baja selección de variedades.

5.10

C

Fincas de gran tamaño, mediana y alta superficie cultivada, mediana selección de la fuentes y dosis de fertilizantes fosfatados y potásicos; sin embargo, las dosis de nitrógeno son de medias a altas; la asistencia técnica es mediana, así como también la selección de variedades.

18.33

D

Fincas de gran tamaño, alta superficie cultivada, óptima selección de fertilizantes, óptima dotación de maquinaria agrícola y facilidades en finca, óptima selección de la fecha de siembra, dosis de fósforo y potasio, pero no adecuada en relación con el nitrógeno, la aplicación del fertilizante es fraccionada, sin limitaciones por cosechadoras, con óptima asistencia técnica, sin limitaciones por enfermedades y mediana selección de variedades.

16.25



CONCLUSIONES

El ACP es una poderosa herramienta para describir la diversidad de todos los elementos o variables que interactúan o son independientes en la continuidad de un sistema de producción.

La identificación de las variables estratégicas o determinantes y sus interacciones permite generar subgrupos homogéneos sobre la base de la inclusión de todas las variables que son importantes para el sistema. Este método de clasificación es particularmente importante en este tipo de trabajos ya que la separación entre subgrupos es más atenuada, semejando lo que sucede en la realidad.

De la determinación de los componentes que interactúan en la producción de arroz del SRRG, se pueden extraer un conjunto de conclusiones de utilidad para los productores, las asociaciones que los agrupan, organismos de investigación y crediticios, de asistencia técnica y como una primera aproximación para continuar las investigaciones de este sistema de producción.

Se debe resaltar el hecho de que no hay un modelo de finca exitosa dentro del sistema. Existen tres factores que son los de mayor incidencia en la producción arrocera del SRRG: dimensión, tamaño o escala de la finca, fuentes y dosis de fertilización y tipo del riego.

SUMMARY

Principal components analysis is (PCA) applied to classify individual farms. The case of rice production at Rio Guarico Irrigation System is used to show the goodness of PCA to summarize the relationships between 24 original variates. The firt seven components synthesize up to 58.99% of the total variation using correlation matrix. A total of 529 farms were clasiffied in four strata based on how the rice production is conducted: good, medium, acceptable and bad. No successfully agricultural management model was detected and variables better describing the productivity on particular farms were: farm size, fertilization source and quantity, and type of irrigation system used.

Key Words: Oriza sativa; farms; fertilization; irrigation.

BIBLIOGRAFIA

ARIAS, L.F., J. CASTILLO, P. GARCIA, A. GOMEZ, M. MIRELES, M. ROSELLO y L. SALAZAR. 1981. Metodología para el estudio de los sistemas de producción agropecuaria. Instituto de Investigaciones Agrícolas Generales. CENIAP Maracay, Venezuela. p. 8-12.

ARIYO, O.J. and A. ODULAJA. 1991. Numerical analysis of variation among accessions of okra Abelmoschus esculentus (L) Moench. Ann. Bot. 67:527-531.

BARNETT, T.P. 1977. The principal time and space scale of the pacific trade wind fields. J. Atm. Sci. 34:221-236.

BRIER, G. W. and T.G. MELTESEN. 1976. Eigenvector analysis for prediction of time series. Notes and Correspondence 15:1307-1312.

CHATFIELD, C. and A.J. COLLINS. 1980. Introduction to multivariate Analysis. Chapman and Hall. New York. 246 p.

CLOUET, Y. 1983. Formation a L'analise des Systemes de production. 1, Analyse du Milieu Rural-concepts, Document de Travail Diffucion Restreinte, Missión Systemes Agraires, IFARC-GERDAT.

CHRISTOPHERSEN, N. and R. HOOPER. 1992. Analysis of stream water chemical data: the use of principal components analysis for the end-member mixing problem. Water Resour. Res. 28(1):99-107.

DAVIS, M.J., F. ESTIS, P. BLOOMFIELD and J.F. MONAHAN. 1991. Complex principal component analysis of sea-level pressure over the eastern USA. International J. Clim. 11:27-54.

FREITES, M.H.E. 1991. Determinación de las relaciones entre los componentes en la producción de arroz oryza sativa L. en el sistema de riego rio Guárico. Universidad Central de Venezuela. Facultad de Agronomía. Maracay. 100 p.

FUNDORA, Z., M. DIAZ, M.R. BAEZ y J.A. SOTO. 1988. Análisis de los componentes principales de la variación en siete cultivares de cebolla. Ciencias de la Agricultura 33:70-81.

HERMY, M. and J.L. PAUL. 1991. Multivariate ratio analysis, a graphical method for ecological ordination. Ecology 72:735-738.

HOBSON, G., C. GOUGH and C. TOWNLEY. 1990. Measuring consumer reaction to the flavour of fresh tomatoes. Acta Hortic. 259:107-116.

IEZZONI, A.F. and M.P. PRITTS. 1991. Applications of principal component analysis to horticultural research, Hort. Sci. 26:334-338.

KOSAKI, T. and A.S.R. JUO. 1989. Multivariate approach to grouping soils in small fields. I. Extraction of factors causing variation by principal component analysis. Soil Sc. Plant Nutr. 35:469-477.

KUTZBACH, E.J. 1967. Empirical eigenvectors of sea-level pressure, surface temperature and precipitation complexs over North America. J. Appl. Meteo., 6"791-802.

LEGATES, D. 1991. The effect of domain shape on principal components analysis. Inter. J. Clim. 11:135-146.

MINISTERIO DE AGRICULTURA Y CRIA (MAC). 1990. Infraestructura de hidrabonificación y trabajos de adecuación parcelaria proyecto Guárico. SRRG, Dirección General Sectorial Saneamiento y Riego. Calabozo. Venezuela. 24 p.

MARDIA, K.V., J.T. KENT and J.M. BIBBY. 1979. Multivariate analysis, Academic Press. Londres. 521 p.

MORIN E., A. BOUCHARD and P. JUTRAS. 1989. Ecological analysis of disturbed riverbanks in the Montreal area of Québec. Env. Manag. 13:215-225.

MORRISON, D. 1976. Miltivariate Statistical Methods. 2da. McGraw-Hill. Calif. 415 p.

NASH, M.H. and L.A. DAUGHERTY. 1990. Statistical comparison of soil map-unit boundaries. Soil Sci. Soc. Am. J. 54:1677-1681.

OVALLES, F.A. and M.E. COLLINS. 1988. Variability of Nortwest Florida soils by principal component analysis. Soil Sci. Soc. Am.J. 52:1430-1435.

PHILIPPEAU, G. 1990. Como interpretar los resultados de un análisis en componentes principales. Institut Techniques des Cereales et des fourrages. París-France. 63 p.

PLA, L. E. 1982. Un modelo en el análisis de la vegetación del estado Falcón. Tesis Magister Scientiarum. Universidad Central de Venezuela UCV. Postgrado de Estadística. Venezuela. 245 p.

PLA, L. E. 1986. Análisis multivariado: método de componentes principales. OEA. 97 p.

POWERS, J.J. 1988. Uses of multivariate methods in screening and training seseory panelists. Food Technol. 42:123-127.

QUEVEDO, R.L. 1991. Una metodología para un estudio de las fincas de producción lechera en el estado Yaracuy. Universidad Central de Venezuela, UCV. Facultad de Agronomía. Maracay-Venezuela. 340 p.

REDMOND, K.T. and W.R. KOCH. 1991. Surface climate and streamflow variability in the Western United States and their relationship to large-scale circulation indices. Water Resou. Res. 27:2381-2399.

RESURRECCION, A.V.A. 1988. Applications of multivariate methids in food quality evaluation. Food Technol. 42:128-134.

RICHMAN, B.M. 1981. Obliquely totated principal components: an improved meteorological map typing technique. American Meteorological Society 20:1145-1159.

SAS Institute Inc. 1988a. SAS/GRAPHTM User's Guide. Release 6.04 Edition. Cary.NC: SAS institute Inc. 549 p.

SAS Intitute Inc. 1988b. SAS/GRAPHTM User's Guide. Release 6.04 Edition. Cary.NC: SAS Institute Inc. 1028 p.

SHARMA, H. 1988. No-choice cage technique to screem for resistance to sorghum midge (Diptera:Cecidomyiidae). J. Econ. Entomol. 81(1):415-422.

SHUH, W., M. JEGER and R. FREDERISKSEN. 1987. The influence of soil environment of the incidence of sorghum downy mildew: a principal component analysis. Phytopathology. 77(2):128-131.

THORPE, R.S. 1988. Multiple group principal component analysis and population differentiation. J.Zool. 216:37-40.


^

Agronomía Tropical  > Colección  >  Sumario Volumen 44 Articulo