viernes, 22 de enero de 2016

El documento y sus clases

Temas de Biblioteconomía
El documento y sus clases
Análisis documental:
indización y resumen
Autor: César Martín Gavilán
Fecha: 07/04/09
1
El concepto de documento y sus clases
Distinción entre dato, información y conocimiento
Datos, información y conocimiento se ubican respectivamente en tres niveles
diferentes. En primer lugar, los datos se hallan en el territorio de lo físico. En
segundo lugar, la información no es un conjunto especial de datos, sino que se
sitúa en el territorio de lo conceptual: la información es el contenido semántico
de los datos. Por último, el conocimiento, como estado cerebral o disposición
neuronal, pertenece al territorio de lo mental.
• Dato como soporte físico de la información: podemos identificar los datos
como acaecimientos físicos (pequeñas parcelas (o trozos) de la realidad)
susceptibles de transportar asociada cierta información. Poseen una
naturaleza material y pueden ser considerados como el soporte físico de la
información. Cada uno de los enunciados (impresos o en soporte
electrónico, dependiendo del formato o versión que esté utilizando el lector)
que aparecen en este tema pueden ser considerados como datos. Es
importante señalar algunas características de los datos de la mano de esta
caracterización. Por un lado, al ser acaecimientos físicos, los datos son
sencillos de capturar, estructurar, cuantificar o transferir. Por otro, que un
mismo dato puede informar o no a un individuo dependiendo, como veremos
a continuación, del bagaje previo de conocimiento del individuo. Además, los
datos acostumbran a ser conjuntos de caracteres alfanuméricos
materializados sobre un documento (físico o electrónico). Según esta
caracterización, es posible abarcar sin tensión el sentido que se le da al
concepto de dato en informática y telecomunicaciones: conjunto de
caracteres asociados a un concepto. El conjunto de caracteres “35.879.987”
respecto al concepto número del documento nacional de identidad (DNI),
podría ser un ejemplo.
• Información como contenido semántico del dato: la información no posee
una naturaleza física o material (como pasa en el caso de los datos), sino
que pertenece al territorio de lo conceptual. Lo que permite que un dato
transporte cierta información es la existencia de un código (o clave de
codificación) que le asocia cierto contenido informativo. La información no
depende de los receptores, sino de la clave de codificación que pone en
relación el dato y aquello sobre lo que éste informa. El dato o conjunto de
caracteres “Real Madrid – FC Barcelona: X” que aparecen en la página del
periódico del lunes informa de que el Barça y el Real Madrid han empatado
gracias a la existencia de un código (una clave de codificación) que le asocia
ese contenido semántico al dato físico. Es importante distinguir entre dos
fenómenos relacionados pero a la vez distintos: transportar información y
adquirir información. Transportar información es una propiedad que poseen
los datos gracias a la existencia de claves de codificación. Adquirir
2
información, en cambio, es una propiedad que poseen los individuos cuando
son capaces de asimilar, a partir de su bagaje previo de conocimiento, la
información que transporta un dato al interpretar ese dato a partir de la clave
de codificación que se utiliza.
• Conocimiento como estados mentales de un individuo a partir de la
asimilación de información: el conocimiento debe ser identificado con un tipo
especial de estados mentales (o disposiciones neuronales) que posee un
individuo y que presentan una serie de características propias. Por un lado,
son estados mentales que adquiere el individuo a partir de un proceso de
asimilación o metabolización de información. En este sentido el contenido
semántico de esos estados mentales coincide con esa información
asimilada. Y, por otro, actúan de guía en las acciones y la conducta de ese
individuo. Sin embargo, las características del conocimiento no acaban aquí.
El conocimiento, a diferencia de los datos y la información, se encuentra
estrechamente relacionado con las acciones y las decisiones del sujeto que
lo realiza; se llega incluso a poder evaluar ese conocimiento utilizando como
indicativo esas acciones y decisiones. El conocimiento, además, es el factor
crítico que permite la asimilación de nueva información, y por tanto la
creación de nuevo conocimiento, por parte del sujeto que lo posee y suele
verse reestructurado continuamente por las entradas de nueva información
asimilada.
El concepto de documento como soporte de la información
Una vez esbozada la distinción entre los conceptos de dato, información y
conocimiento, queda describir cuál es el papel que juega el concepto de
documento dentro de todo este escenario.
En términos generales, se puede afirmar que los documentos siempre se han
visto involucrados en la actividad intelectual del ser humano. Desde el principio
de la historia del pensamiento, el hombre ha utilizado una serie de objetos o
materiales donde poder plasmar y almacenar aquello que pensaba o sentía.
Las pinturas rupestres, las tabletas de arcilla mesopotámicas, los muros de los
edificios sagrados egipcios, los papiros, los pergaminos o, posteriormente, el
papel, son claros ejemplos de tipo de objeto o materiales. En la actualidad, con
el desarrollo de las tecnologías de la información y la comunicación, se está
apostando cada día más por los formatos digitales para recoger la producción
intelectual.
Para referirnos a todo este tipo de objetos o materiales utilizamos normalmente
el término “documento”. O, dicho de otra manera, es posible identificar como
documento todo aquel soporte donde se represente algún tipo de información.
En este sentido, podemos incluir bajo el concepto de documento una hoja de
papel escrito, un libro, una fotografía, una cinta de video, un DVD, un archivo
creado con un procesador de textos, una base de datos o una página web.
3
Los documentos se caracterizan por poseer dos dimensiones: por un lado son
algo físico y, por otro, contienen asociado un contenido informativo o
información.
La relación entre los conceptos de documento y dato parece bien sencilla. Si el
dato es el soporte físico de la información, el documento debe ser entendido
como un conjunto de (un tipo especial de) datos.
Sobre la relación entre los conceptos de documento e información, diremos que
si la información debe entenderse como el contenido semántico del dato
derivado de una clave de codificación, el documento aparece como el objeto
material donde se puede representar y materializar información. Esta
representación y materialización permite explicar varias cosas. Por un lado,
permite explicar cómo se puede transmitir la información: la información se
representa (se asocia) en un documento a partir de un código y su transmisión
se produce a partir de la propia transmisión material del documento. Y, por otro
lado, permite también dejar claro por qué la conservación y almacenamiento
del documento significa también la conservación y almacenamiento de la
información que éste contiene. Sólo cabe analizar ese documento bajo la
misma clave de codificación (o código) que se utilizó para asociarle ese
contenido semántico concreto para poder recuperar esa información después
del almacenamiento del documento.
Por último, en lo que se refiere a la articulación del concepto de documento
frente al de conocimiento, entendido como estados mentales de un individuo
construidos a partir de la asimilación de información y que rigen las acciones
del propio sujeto. Frente a estos estados mentales, y a partir de su dimensión
física y su capacidad de transportar información, el documento juega un papel
muy importante: éste aparece como ese objeto material donde se puede
representar y materializar esos estados mentales que residen exclusivamente
en la cabeza de las personas. Y, al igual que pasaba en el caso de la
información, esta representación y materialización permite explicar la
transmisión y el almacenamiento de conocimiento a partir de la transmisión y
almacenamiento de documentos.
En este sentido, por un lado, el conocimiento que reside en la cabeza de un
individuo se plasma en un documento a partir de un código y su transmisión se
produce a partir de la propia transmisión material del documento: cuando otro
individuo es capaz de obtener la información asociada a ese documento
transmitido y formar un nuevo estado mental a partir de la misma, podemos
afirmar que se ha producido la transmisión de ese conocimiento. Por otro lado,
a partir del mismo mecanismo, la conservación y almacenamiento del
documento que se obtiene como fruto de la representación de un conocimiento
concreto permite también la conservación y almacenamiento de ese
conocimiento. Basta analizar ese documento bajo el mismo código que se
4
utilizó en la representación de esos estados mentales para poder recuperar la
información asociada y crear nuevos estados mentales en otros individuos
después del almacenamiento del documento. De esta manera ese
conocimiento puede ser recuperado por cualquiera que lo necesite en el
momento adecuado.
Clases de documentos
Para la ciencia de la documentación, el documento es a la vez medio y
mensaje de información y conocimiento. De esta manera, el documento se
caracteriza por una triple dimensión: el soporte físico o material, el mensaje
informativo y la posibilidad de transmisión o difusión de este conocimiento. Esta
triple dimensión que caracteriza al documento ha servido, a su vez, para
establecer una tipología de los documentos en la que los estudiosos del campo
de la documentación coinciden, más o menos, y que se puede resumir de la
siguiente forma:
• Según el soporte material hablaríamos de documentos de papel (libros,
revistas, folletos, etc.), material químico (películas), material magnético
(cintas de vídeo, disquete de ordenador, casetes, etc.),soportes ópticos (CDROM,
DVD, video-discos, etc.), etc.
• Según el mensaje informativo:
o por la forma de expresión del contenido hablaríamos de documentos
textuales (libros, revistas, etc.) y documentos no textuales (gráficos como
mapas, planos, etc.; sonoros como cintas, discos, etc.; iconográficos
como fotografías, carteles, etc.; audiovisuales como películas, vídeos,
etc.; informáticos como programas de ordenador; tridimensionales como
esculturas o juguetes; compuestos o multimedia cuando el documento
combina varios contenidos mencionados anteriormente);
o por la transformación del contenido hablaríamos de documentos
primarios (originales, como libros y revistas, etc.), secundarios (que hacen
referencia a los documentos primarios, como bibliografías, catálogos,
índices, sumarios, boletines, bases de datos, etc.) y terciarios (tienen
estructura formal de secundarios, pero contenido primario, como los
diccionarios, enciclopedias, léxicos, tesauros, etc.).
• Según la posibilidad o forma de transmisión o difusión, desde el punto de
vista social hablaríamos de documentos públicos, reservados e inéditos; y
desde el punto de vista temporal hablaríamos de documento periódicos o no
periódicos (de naturaleza monográfica).
En este tipo de clasificaciones tradicionales, no encontramos por ninguna parte
términos como documento electrónico o digital. Será necesario, pues, ampliar
esta tipología para dar cabida a los nuevos tipos de documentos surgidos
5
gracias a la revolución digital, a la tecnología hipertextual y la aparición de la
Web y de Internet. Por ello debemos tener en cuenta:
• Nuevos materiales (documento electrónico/documento impreso): un
documento electrónico difiere de un documento impreso en el material que lo
conforma. Tablas de cera o arcilla, papiro, pergamino y papel han abierto
paso a los discos y cintas magnéticas (casete, cinta de vídeo, disquete,
disco duro de un ordenador, tarjetas de memoria, etc.) y a los discos ópticos
(CD-ROM, DVD, etc.) que se imprimen y leen mediante láser sin que exista
un contacto directo con el soporte. Ambos, documento impreso y documento
electrónico, pueden contener el mismo texto, aunque cambia el soporte. Un
documento electrónico es aquel cuyo contenido está en un soporte
electrónico que, para su acceso, requiere una pantalla textual, una pantalla
gráfica y/o unos dispositivos de lectura de audio, vídeo, etc. según el tipo de
información que contenga. En algunos casos también se precisa la
mediación de un ordenador (cuando la información está digitalizada) y en
otros no (si se trata de información analógica).
• Nueva codificación de la información (documento digital/documento
analógico): a menudo se identifica un documento electrónico con un
documento digital, sin embargo, si hablamos con propiedad, no son la misma
cosa. Un documento electrónico puede ser bien analógico, bien digital.
Documentos electrónicos son, por ejemplo, una cinta de casete o una cinta
de vídeo, que precisan de un dispositivo electrónico para su lectura, pero no
son digitales. Lo que distingue un medio electrónico de un medio digital es,
por una parte, la forma en que está codificada la información y, por otra, la
necesaria mediación de un ordenador para decodificar esta información. En
el caso de un documento digital, la información está codificada en bits, y
para leer, visualizar o grabar la información se precisa de un dispositivo que
transmita o grabe información codificada en bits. Al representarse
digitalmente, los datos de entrada son convertidos en dígitos (0,1) inteligibles
para la máquina y no para los sentidos humanos; y a la salida, otro
dispositivo los convertirá en señales analógicas, inteligibles para los sentidos
humanos. Un documento digital es, pues, aquél que contiene la información
codificada en bits. De esta manera, las distintas morfologías de información
(texto, imagen y sonido) se codifican en cadenas de ceros y unos. La
dicotomía, pues, no sólo se establece entre documento impreso y
documento electrónico, sino también y dentro de los propios documentos
electrónicos, entre documento digital y documento analógico. Es claro que
los medios analógicos (libros, periódicos, revistas, folletos, etc.) conviven
hoy con los medios digitales a pesar de que se habla de que vivimos en la
sociedad de la información entendiendo ésta como eminentemente digital,
basada en el uso de los ordenadores y las redes de transmisión de datos.
Existe un factor clave que favorece el avance de la información digital: la
6
producción, distribución, acceso y reusabilidad (esto es, la facilidad de
selección, recuperación, reproducción y transmisión) es mucho más sencilla,
accesible, rápida y barata que la de la información impresa.
• Nuevos tipos de documentos (documento virtual/documento real): Los
documentos digitales pueden ser estáticos y persistentes o pueden ser
generados dinámicamente y ser virtuales. Un documento virtual es un
documento para el que existe un estado no persistente y en el que algunas o
todas sus instancias se generan automáticamente en un lapso de tiempo. Un
documento virtual puede entonces consistir de múltiples páginas, una visita
guiada, applets de Java y puede tener o no tener enlaces (esto es, puede o
no ser hipertextual). El contenido puede definirse mediante etiquetas o tags,
una plantilla de documento, un programa informático, una consulta a una
base de datos u otras muchas aplicaciones que sindican contenidos. Los
documentos virtuales han emergido al mismo tiempo que la interactividad y
el deseo de obtener y recuperar documentos "a la carta", particularmente en
la Web. Hasta el nacimiento de la WWW, el acceso a la información ha
consistido en la recuperación de copias electrónicas de los documentos de
un gran depósito de información relativamente estática. El término estático
no se refiere aquí a la estabilidad de los documentos (que en la web se
modifican y actualizan constantemente, cambian de lugar, desaparecen,
etc.) sino a que el documento ya existe y tiene unos límites bien definidos.
Lo que sucede ahora es que el acceso a la información se realiza a través
de la manipulación de una gran colección de fuentes y recursos de
información diferentes y que algunos de esos recursos son documentos y
otros son procesos que crean documentos. El nacimiento de este nuevo tipo
de documentos establece una nueva dicotomía entre los términos
documento real (es el que se puede consultar sin ningún cambio, esto es, en
su estado presente, actual) y el documento virtual, entendido como un
documento que no es real, pero que contiene los datos específicos
necesarios para producirlo. Se trata de una colección no organizada de
bloques de información, junto con las especificaciones necesarias
(herramientas y técnicas) que permiten la generación de un documento real.
Vemos entonces que la definición de documento debe ser lo más amplia
posible, ya que tiene que integrar una gran variedad de soportes, formatos y
distintas morfologías. La tipología de los documentos también se va ampliando
a medida que surgen nuevas formas y tecnologías de lectura y escritura,
nuevas formas de acceso y recuperación del documento, nuevas formas de
estructurar la información y nuevos modos de interacción por parte del usuario.
A la escritura manuscrita a través de diversos dispositivos (cuñas, pinceles,
cañas, plumas, lápices, bolígrafos), le han seguido la tecnología de la imprenta,
las máquinas de escribir y otros dispositivos electrónicos, los ordenadores y las
redes telemáticas. Todos estos medios de escritura conviven hoy en el tiempo.
7
Los sistemas de gestión de hipertextos, los lenguajes hipertextuales, los
lenguajes estructurados y la Web han incrementado la escala de los sistemas
de recuperación de la información y han introducido nuevas nociones y nuevos
tipos de documentos. Podemos, pues, ampliar la tipología clásica de los
documentos incluyendo nuevos tipos como los siguientes:
• Según el soporte material hablaremos de documentos físicos (soportes
tradicionales como el papel o la película; soportes magnéticos como el
videocasete o el disco duro; y soportes ópticos como el CD o el DVD) y
virtuales (en línea, alojados en la memoria de servidores remotos).
• Según el mensaje informativo:
o por la forma de expresión del contenido hablaremos de documentos
reales y documentos virtuales (tanto hipertextuales como conceptuales)
o por la posibilidad de transformación del contenido por parte del usuario
hablaremos de documentos estáticos y documentos dinámicos (que
permiten la interactividad del usuario y pueden generarse mediante
diferentes aplicaciones).
o por su forma de codificación hablaremos de documentos analógicos (su
paradigma lo constituye, por una parte, el libro impreso, pero también
objetos como la microforma, la cinta de video o el registro fonográfico.) y
documentos digitales.
• Según el tipo o posibilidad de acceso:
o por el tipo de acceso al documento hablaremos de documentos locales
(el acceso se realiza a través de un soporte físico como es el disco duro
del ordenador o a través de algún periférico) o documentos remotos (el
acceso se realiza en línea a través de una red).
o por la posibilidad de acceso, transmisión y difusión, desde el punto de
vista social hablaremos de documentos públicos y documentos privados;
desde el punto de vista temporal hablaremos de documentos
permanentes y de documentos transitorios; y desde el punto de vista
espacial hablaremos de documentos en línea (acceso a través de Interner
o una intranet) y documentos fuera de línea.
• Según el tipo de autor, hablaremos de documentos de autoría individual
(personales, institucionales y corporativos) y documentos de autoría
colectiva (tanto participativos, caso de los blogs, wikis y demás redes
sociales, como no participativos).
Y aunque esta lista no pretende ser exhaustiva, sirve para mostrar cómo la
tecnología digital e Internet han dado paso a nuevas concepciones teóricas y
8
prácticas del documento y a la necesidad de establecer nuevas tipologías
documentales.
Análisis documental
El análisis documental se puede definir como el conjunto de operaciones (unas
técnicas y otras intelectuales) que se realizan para representar tanto la forma
como el contenido de documentos primarios, generando de esta forma otros
documentos secundarios cuyo objetivo no es otro que facilitar al usuario la
identificación precisa y recuperación posterior de los documentos primarios
representados. Por ejemplo, son fruto del análisis documental las
construcciones descriptivas estructuradas y normalizadas que creamos para
proporcionar al usuario información bibliográfica de documentos a los que se
puede acceder de alguna forma en o desde nuestra biblioteca: es decir, los
registros bibliográficos de nuestro catálogo son el producto de un análisis
documental. Desde el punto de vista de la recuperación de la información,
estos documentos secundarios son tremendamente útiles y poseen ventajas
evidentes frente a los propios documentos primarios (siempre y cuando el
análisis documental se haya realizado respetando normas y convenciones,
claro está): son más manejables, facilitan la identificación del documento
original y establecen vías de acceso a su información.
Muchos y muy diversos pueden ser los métodos de análisis utilizados para
representar los documentos. La mayor o menor profundidad del análisis
dependerá en gran medida de aspectos como:
• Tipo de usuarios y necesidades de información más o menos
especializadas
• Tipo de servicios que se ofrecen (no es lo mismo una biblioteca pública
que una biblioteca universitaria)
• Tipo de documentos a analizar (libros, artículos de revistas, literatura gris,
prensa, legislación…)
En cualquier caso, el concepto de análisis documental abarca siempre la
descripción formal (externo) y la descripción del contenido (interno) del
documento.
• El análisis documental como descripción formal: este proceso, más
técnico que intelectual, tiene como objetivo solucionar el problema de la
identificación de los documentos primarios para facilitar su localización o
acceso posterior. Su campo de actuación se concreta en dos operaciones
distintas:
9
o la descripción bibliográfica: entendida como la recolección y
presentación organizada de los elementos o datos identificativos del
documento. Por ejemplo, de forma normalizada siguiendo las áreas
descriptivas de la ISBD.
o la catalogación: entendida como la elección de los puntos de acceso
formales que guiarán el camino hacia la descripción bibliográfica. Por
ejemplo, de forma normalizada siguiendo los capítulos 14-16 de las RC (o
la segunda parte de las AACR2).
• El análisis documental como descripción del contenido: se trata de una
operación más intelectual que técnica y, por lo tanto, más compleja, que
pasa necesariamente por la identificación del contenido de los documentos,
producto de la cual se crean puntos de acceso semánticos o resúmenes,
que no sólo son unos eficaces intermediarios entre los documentos primarios
y sus posibles usuarios, sino que a veces desempeñan misiones de anticipo
o incluso sustitutos de los documentos que representan. Las operaciones de
análisis documental interno son de tres tipos:
o Clasificación: operación de síntesis que trata de discernir el contenido
fundamental de los documentos para formalizarlos y representarlos
mediante la ayuda de un lenguaje artificial preestablecido.
o Indización: operación de análisis que trata de retener las ideas más
representativas para vincularlas a unos términos de indización
adecuados, bien procedentes del lenguaje natural o documental.
o Resumen: operación de análisis y síntesis que trata de representar de
forma abreviada el contenido del documento primario, constituyendo en sí
mismo una entidad documental autónoma.
Dejando de lado la clasificación, en este tema nos centraremos en la indización
y el resumen.
La indización
La UNESCO define indización como un proceso que consiste en describir y
caracterizar un documento con la ayuda de representaciones de los conceptos
contenidos en dicho documento. Para Neet indizar es “analizar los documentos
y aislar en la riqueza del lenguaje natural empleado por los autores, todos los
conceptos esenciales o pertinentes que deben ser retenidos en previsión de
búsquedas posteriores”.
Con base en la anterior definición, el término indización debe entenderse como
un proceso que consiste en conceptualizar el contenido del documento y
traducirlo a un lenguaje normalizado como descriptores e identificadores, o a
un lenguaje libre expresado en palabras claves, con la finalidad de crear
10
índices, los cuales son generados en la actualidad por los sistemas de gestión
de las bases de datos.
Este proceso supone un análisis del contenido del documento, basado en el
conocimiento de la disciplina, la estructura del documento, las necesidades del
usuario y el vocabulario normalizado que se utiliza. De la fidelidad, consistencia
y especificidad en la asignación de términos, depende la pertinencia y precisión
en la recuperación de la información, ya que el lenguaje del análisis es el
puente entre la información que contiene el documento y el usuario que
consulta la base. Tratándose de un proceso subjetivo, la posibilidad de reflejar
con exactitud el contenido de un documento es algo no siempre factible.
Ensayos sobre la coincidencia en la asignación de términos a un mismo
documento entre varios documentalistas han demostrado que, aún siendo
expertos en el campo de estudio, la concordancia en la terminología de la
indización apenas alcanza el 40% de promedio. Esto refleja el difícil papel del
profesional de la documentación en la complicada y costosa tarea de
interlocutor entre el contenido y naturaleza del documento y la necesidad del
usuario, sobre todo en la actualidad, con este cambiante escenario de las TICs
que hace más complicado si cabe el proceso del análisis documental.
Los principales factores que afectan a una buena indización son:
• Especificidad: nos referimos al nivel de concreción que deben tener los
descriptores en relación con el tema del documento. Así un trabajo sobre
impuestos concretos como el IRPF o el IVA deberá ser analizado por dichos
términos, siendo demasiado genérico la utilización del concepto “sistema
fiscal”. ¿Hasta qué punto debe ser específica una indización? Hasta el
mismo que el tema del documento lo exija. Esto no significa que en algunos
casos, y siempre que las necesidades de información de los usuarios así lo
recomienden, podamos añadir un término genérico.
• Exhaustividad: relacionado con el concepto anterior, la exhaustividad
implica reflejar todos los temas y conceptos relevantes. Es difícil valorar este
aspecto ya que, aunque una gran cantidad de entradas puede facilitar la
recuperación de un documento, muchas veces este factor entra en
contradicción con la pertinencia del documento hallado.
• Pertinencia: es el elemento fundamental a tener en cuenta para una
buena indización. La pertinencia de un descriptor representa su grado de
adecuación al concepto expresado en el texto original. Un buen descriptor
debe ser siempre un punto preciso y fiel de acceso y responder a las
expectativas de búsqueda del usuario. El indizador debe siempre ponerse en
el lugar del especialista que cuando busca por ese término que hemos
utilizado va a encontrarse con el documento que se está analizando.
11
• Coherencia: la coherencia en la indización se refiere al grado de
concordancia, uniformidad entre indizadores o un mismo indizador. Una
medida de coherencia puede hallarse a través del promedio de descriptores
comunes. La coherencia depende del número de descriptores asignados, del
vocabulario utilizado, de la terminología del documento y, en general, de la
capacidad de conceptualizar del responsable de la indización.
Según la norma UNE 50121:1990 Métodos para el análisis de documentos,
determinación de su contenido y la selección de los términos de indización
(equivalente a la ISO 5963:1985), la indización consiste en tres etapas, que
tienden a solaparse en la práctica:
• Examen del documento y determinación del contenido a partir del título,
resumen, sumario, introducción, conclusiones, notas,...
• Identificar y selección de los conceptos teniendo en cuenta el nivel de
indización escogido
• Traducción de los principales conceptos escogidos al lenguaje de
indización
Hay diversos sistemas de indización, entre los que se encuentran:
• Indización por palabras clave (lenguaje libre): mediante colección no
ordenada (sólo en orden alfabético) de palabras significativas o no vacías
(es decir, todo aquello que no son artículos, conjunciones, pronombres,
preposiciones, numerales, ciertos verbos y adverbios), extraídas
automáticamente por un ordenador a partir del título, del resumen y, cada
vez más a menudo, del texto completo de los documentos registrados dentro
un determinado sistema documental.
• Indización por descriptores libres (lenguaje libre): mediante colección no
ordenada (sólo en orden alfabético) de conceptos destacados, por un
proceso intelectual, a partir de los documentos registrados dentro un sistema
documental determinado. Estos conceptos son expresados por palabras o
expresiones extraídas de los documentos, o propuestos por los
documentalistas, sin verificar si existen en una lista establecida a priori
• Indización por autoridades (lenguaje controlado): mediante colección no
ordenada (sólo en orden alfabético) de conceptos destinados a representar
de manera unívoca el contenido de los documentos y de las consultas dentro
un sistema documental determinado. Estos conceptos son expresados por
palabras y expresiones extraídas de una lista finita hecha a priori; sólo los
términos que hay en la lista pueden ser utilizados para indizar los
documentos y realizar consultas.
• Indización por tesauros (lenguaje controlado): mediante lista estructurada
de conceptos destinados a representar de manera unívoca el contenido de
12
los documentos y de las consultas dentro un sistema documental
determinado. Los términos forman una lista finita establecida a priori. Sólo
los términos que están en la lista pueden ser empleados para indizar los
documentos y realizar consultas. Se ordena generalmente alfabéticamente,
pero acepta otras formas de presentación. Las relaciones de equivalencia,
jerárquicas y asociativas entre los términos están más trabajadas que en las
listas de encabezamientos de materia. Son ámbitos temáticos
especializados. Su elaboración exige un estudio previo del área temática a
cubrir. Se basa en la postcoordinación.
• Indización por listas de encabezamientos de materia (lenguaje
controlado): mediante lista ordenada alfabéticamente, y no estructurada
conceptualmente, de aquellos términos que deben representar de forma
unívoca el contenido de los documentos. Los términos forman parte de una
lista establecida a priori. Sólo los términos que aparecen en esta lista
pueden utilizarse para indizar. Se emplea con fondos generales o
enciclopédicos. Son útiles tanto para búsquedas manuales como
automatizadas. Se basa en la precoordinació. El encabezamiento de materia
representa un término del documento mediante una serie de términos del
lenguaje natural y relacionados entre sí (encabezamiento y
subencabezamientos).
La indización automatizada
La generación de índices en una base de datos con las palabras extraídas del
título, resumen y palabras claves del autor, fue el primer método utilizado para
indizar documentos en bases de datos bibliográficas. En la extracción de
ocurrencias los sistemas informáticos han mostrado una enorme eficacia. Pero
no olvidemos ésta es sólo la primera parte del proceso de indización, aunque
realmente la mayor parte de los llamados motores de búsqueda se quedan en
este primer paso y generan índices a partir de la simple extracción de palabras.
El paso siguiente es la asignación, que implica, o debería implicar, la traducción
de las palabras extraídas en términos que describen el contenido. Los
algoritmos que se usan para este proceso, llamados en inglés de assignment
indexing son varios: en algunos casos el sistema posee un tesauro, que
funciona para el control terminológico y que dispone de conjuntos de términos
que permiten vincular los términos extraídos con los del lenguaje controlado.
La presencia de grandes masas textuales en la Web y la difusión de los
lenguajes de marcado ha producido una modificación en las perspectivas de
trabajo. A partir de ese momento, con la complementariedad de formas de
extracción y asignación en ambiente Web, podemos decir que nos
encontramos ya frente a lo que se conocen como sistemas asistidos de
indización automática (Computer Assisted Indexing systems, CAI).
13
Los CAI se caracterizan por su capacidad de manipular documentos
extrayendo palabras significativas del título, resumen y palabras claves
asignadas por los autores, o del texto del documento, transformando las
palabras extraídas mediante algún procedimiento de análisis, en una
asignación de términos que pretende representar el contenido. Por tanto, en los
CAI hay que considerar cuáles son los procedimientos de extracción y de
análisis. Metodológicamente utilizan diferentes enfoques: análisis semántico,
análisis conceptual con base estadística y análisis en base a reglas de
reconocimiento, entre otros.
Resumen
Antes de introducirnos en las características de los resúmenes y las
metodologías para prepararlos, parece aconsejable aclarar qué entendemos
por resumen. Un resumen es una representación abreviada y exacta de un
documento, en la medida de lo posible utilizando el propio lenguaje del autor,
en que los puntos contenidos se exponen en el mismo orden que en el original,
sin agregar interpretación o crítica alguna, y sin identificación de quien escribió
el resumen. Debe constituir una entidad en sí mismo y ser fácilmente
comprensible sin hacer referencia al documento original.
Propósitos del resumen
Sin lugar a dudas, la gran disponibilidad de bases de datos bibliográficas en
línea ha cambiado y ampliado el papel de los resúmenes en el pasado. Hoy en
día los resúmenes contenidos en las bases de datos pueden examinarse con la
modalidad de “búsqueda en texto libre”, lo cual permite al usuario realizar
búsquedas en línea por cualquier término que se considere apropiado. El
sistema recupera referencias de todos los documentos cuyos resúmenes
contenga esos términos o combinación de ellos. Este proceso se realiza sin el
uso de un lenguaje de indización específico. Considerando esta opción, cada
día más frecuente, de búsqueda en texto libre, la necesidad de poner especial
cuidado en la construcción del resumen, tanto en sus aspectos de contenido
temático como formales (palabras adecuadas, correcta formación de frases,
etc.), se hace evidente.
Un resumen puede prepararse con diferentes propósitos. Es importante
distinguir estos propósitos pues ellos son determinantes para decidir el tipo de
resumen a utilizar, es decir, si se debe condesar la información de los
documentos o sólo indicar de qué tratar. Podemos distinguir entre propósitos
generales y específicos.
14
Propósitos generales:
• Ayudar a decidir a un lector interesado en el tema de un documento si le
conviene o no leerlo completo.
• Proporcionar al lector interesado parcialmente en el documento, el
máximo de información posible, a fin de evitarle una lectura total.
• Permitir realizar búsquedas a través de un sistema informático.
Propósitos específicos:
• Indicar la naturaleza de la información contenida en el documento original.
• Sugerir la conveniencia de obtener el documento para un estudio
intensivo.
• Proporcionar al lector un medio rápido de mantenerse informado sobre los
avances en su campo de interés.
• Guía al lector a una lectura más inteligente del trabajo original,
destacando de él los aspectos más significativos.
Por otra parte, un resumen puede ser preparado con uno o más de los
siguientes fines:
• Ser publicado en una revista de resúmenes
• Acompañar al documento original
• Ser incluido en un boletín de alerta
• Formar parte del registro bibliográfico y ser almacenado en una base de
datos
Características del resumen
Las siguientes son algunas de las principales característica que debe tener un
resumen:
a) Un resumen debe ser claro, metódico, ordenado. Esto implica un uso
exacto y apropiado de las palabras. La presentación de los conceptos o
temas debe conservar el orden del documento. El resumen debe decir sólo
lo esencial, sin usar un estilo narrativo, pero tampoco telegráfico.
b) Debe ser preciso, vale decir, debemos evitar el uso de términos ambiguos
y de frases coloquiales.
c) El resumen debe ser conciso. Es algo más que preciso y breve. Ser
conciso significa rechazar lo inútil y lo superfluo; evitar los epítetos y la
repetición de términos equivalentes. Significa dar a una frase la plenitud de
su sentido con mínimas palabras.
15
d) Debe ser fiel reflejo del documento original. El resumen debe ser una
imagen reducida del documento original, conteniendo sus elementos
esenciales, esto es, resultados, técnicas o métodos, y conclusiones.
e) Necesita ser autosuficiente. Debe serlo en el sentido de tener una entidad
propia. Esto significa que, acompañado de una correcta cita bibliográfica,
puede existir por sí mismo, sin estar inserto en o acompañado al original.
f) Fácilmente comprensible por sí mismo. En un resumen nunca debe
hacerse referencia al documento, pues el resumen en sí es una abreviación
del original. Por lo tanto, un resumen no debe “contar” de qué trata el
documento, como si se tratara de hechos ajenos. No debe emplearse frases
como “El autor dice…” o “Este artículo trata de…”, etc.
La autoría del resumen
Los resúmenes pueden ser preparados por los autores del documento primario,
por especialistas en el tema, o por profesionales (documentalistas) que
manejan esta técnica. Cada alternativa tiene sus ventajas y desventajas. Sin
embargo, es importante decir que, por lo menos en el caso de los artículos
científicos, es una responsabilidad del autor el acompañar su escrito con un
resumen. En todo caso, la preparación de buenos resúmenes exige a quien
desea realizar este trabajo, cuatro condiciones indispensables: el conocimiento
de tema, el dominio de ciertas técnicas, un muy buen manejo del idioma y una
cierta capacidad.
• Autor: sin duda, el autor tiene el mejor conocimiento de los contenidos del
documento. Además, el hecho de que él prepare un resumen al momento
que presente su trabajo, significará un gran ahorro para los servicios de
resúmenes. Sin embargo, una desventaja es la probable falta de objetividad
del autor respecto a su propio trabajo, lo que le puede llevar a escribir un
resumen que “mejore” el propio documento.
• Expertos: generalmente, los expertos en un tema suelen llegar a escribir
excelentes resúmenes tras recibir un cierto entrenamiento. Su mayor
problema es la dificultad para abstenerse de emitir juicios de valor respecto
al documento. Sin lugar a dudas, sometidos a cierta metodología y disciplina,
pueden escribir mejores resúmenes que los autores.
• Documentalistas: son personas que, sin ser especialistas en el tema,
están entrenados para preparar resúmenes objetivos, no críticos, correctos
en la forma y la extensión. Su entrenamiento enfatiza la inclusión de
palabras claves en el texto, lo que facilita la búsqueda en texto completo. Sin
embargo, estas personas pueden tener serias dificultades al tratarse de
temas complejos o muy especializados.
16
Tipos de resúmenes
Distinguiremos básicamente dos tipos de resúmenes: indicativos e
informativos. Una variación de los indicativos son los llamados resúmenes
“integrados” y la combinación de las técnicas de los resúmenes indicativos e
informativos da lugar a la tipología híbrida del resumen “informativo-indicativo”.
• Resumen indicativo: el resumen indicativo, llamado también “descriptivo”
es aquél que sólo describe brevemente el contenido del documento, sin
incluir aspectos metodológicos, ni las conclusiones del autor. Sólo intenta
ayudar al usuario a comprender el alcance del documento original, sin
entregarle una cuenta detallada de su contenido. Su extensión suele ser
entre 25 y 50 palabras.
• Resumen integrado: esta modalidad de resumen indicativo tiene la
particularidad que el resumen en sí está formado por una serie de palabras
claves, conectadas por conjunciones, preposiciones, formas verbales, etc.
• Resumen informativo: el resumen informativo incluye información sobre
propósito del trabajo, hechos claves, datos, observaciones, metodologías,
hallazgos, conclusiones. El resumen informativo ha sido comparado con una
hoja a la que se le quita toda la pulpa dejando sólo la nervadura. Un perfecto
esqueleto estructural, a partir del cual es perfectamente posible establecer
su apariencia original. Idealmente, el resumen informativo es una versión
abreviada, pero completa e inteligible del contenido significativo y
conclusiones de un documento. Su extensión suele ser entre 200 y 350
palabras. En general, los resúmenes informativos deben ser preparados por
personas especialistas en el tema, o por el autor, siempre que hayan
recibido entrenamiento en la metodología de preparación de resúmenes. El
resumen informativo puede dividirse en cuatro secciones:
o Alcance y propósito
o Métodos empleados
o Resultados obtenidos
o Conclusiones o interpretaciones de los resultados
El mantenimiento de este orden es importante, la información debe
entregarse en este orden dentro de párrafos individuales. La primera parte
del resumen (alcance y propósito) es de particular importancia. Si está bien
escrita, puede ser concluyente para que el lector sepa si el documento es de
su interés. El resto del resumen, aunque esencial, pierde valor sin este
párrafo inicial. En esta parte del resumen, es útil para el lector encontrar
expresiones como: “breve” “exhaustivo”, “teórico”, “experimental”, “de
campo”, etc., que le señalan la forma de tratamiento o enfoque del tema. La
segunda sección (métodos empleados) necesita ser explícita, incluyendo a
veces, equipos y materiales empleados, especialmente si se trata de una
17
metodología novedosa (aspecto este último que sólo puede detectar un
especialista en el tema). La tercera sección (resultados obtenidos) se refiere
a los hallazgos concretos. La cuarta sección (conclusiones) incluye las
recomendaciones y es realmente importante, pues las conclusiones suelen
reflejar el documento entero.
• Resumen informativo-indicativo: conjuga los niveles del resumen
indicativo y del informativo. Las partes centrales son representadas de forma
informativa, mientras que aquellos aspectos de menor transcedencia pero
útiles son tratados indicativamente.
También podemos añadir dos tipos de resúmenes menos frecuentes: el
analítico y el crítico. El resumen analítico supone mayor detalle informativo
(aunque no excede de 500 palabras) y es poco habitual porque requiere
bastante tiempo para su elaboración. El resumen crítico incluye una valoración
sobre la profundidad y alcance del trabajo, metodología y contribución al
desarrollo del conocimiento, y es poco habitual porque requiere que el analista
sea un experto en la materia objeto de investigación.
Pautas y recomendaciones para resúmenes
Además de las pautas que cada servicio de resúmenes establece, existe
normativa internacional para la confección de resúmenes, como la ANSI/NISO
Z39.14:1997 (R2002), Guidelines for Abstracts; la “Guía para la preparación de
resúmenes” de la UNESCO (1968); o la UNE 50103:1990, Preparación de
Resúmenes (equivalente a la ISO 214:1976). Esta última norma, en concreto,
establece las siguientes recomendaciones para la preparación de resúmenes
informativos:
a) Propósito. Debe indicarse los principales objetivos y alcance del estudio, o
bien las razones por las cuales se escribió el documento, a menos que ello
se desprenda claramente del título. Sólo debe hacerse referencia a
publicaciones anteriores si éstas constituyen parte esencial del propósito del
documento.
b) Metodología. Las técnicas o métodos utilizados deben describirse sólo en
la medida necesaria para su comprensión, pero identificando claramente las
técnicas nuevas, describiendo sus principios metodológicos básicos, el
alcance de su aplicación y el grado de exactitud que puede lograr. Si
corresponde, debe señalarse las fuentes de información (encuestas,
revisiones bibliográficas, etc.).
c) Resultados. Los resultados deben describirse en la forma más precisa e
informativa posible. Pueden ser de carácter experimental o teórico, o
consistir en información reunida, en relaciones o correlaciones advertidas, en
efectos observados, etc. Si no es posible incluir todos los resultados
18
novedosos, debe darse prioridad a lo siguiente: verificación de nuevos
hechos, resultados nuevos de valor a largo plazo, descubrimientos
significativos que contradicen teorías anteriores, o que el autor destaca
como especialmente pertinentes en relación con un problema práctico.
d) Conclusiones. Debe describirse el alcance de los resultados,
especialmente en cuanto al propósito de la investigación. Las conclusiones
pueden ir en relación con: recomendaciones, evaluaciones, aplicaciones,
sugerencias, nuevas relaciones e hipótesis aceptadas o rechazadas.
Metodología
El procedimiento utilizado para la preparación de resúmenes, parte con el
análisis conceptual. El propósito de este análisis es extraer ciertas nociones
básicas del contenido temático de un documento. El análisis se realiza
revisando el documento entero y leyendo cuidadosamente secciones
seleccionadas: la tabla de contenido, la introducción, los párrafos iniciales de
los capítulos, las conclusiones, etc. Una vez que el documentalista se ha
familiarizado con el documento, comienza a escribir el resumen; procura
extraer ideas o pensamientos del contexto, y trata de reunirlos
armoniosamente, con la misma intención ideada por el autor.
Es importante saber qué tomar y qué descartar: por lo tanto, es evidentemente
importante el conocimiento que la persona tenga del tema tratado en el
documento. Hay que destacar, sin embargo, que aunque el conocimiento del
tema es esencial, igualmente determinante en la preparación de un buen
resumen es un hábil manejo del idioma y una gran capacidad de análisis y de
síntesis. Y aunque la persona sea experta en este tipo de trabajo, es muy
recomendable que siempre prepare un borrador para luego pulirlo y limpiarlo de
palabras superfluas, cuidando al mismo tiempo la redacción.
19
BIBLIOGRAFÍA
Mario Pérez-Montoro Gutiérrez. "El documento como dato, conocimiento e
información". En: Tradumàtica : traducció i tecnologies de la informació i la
comunicació, Núm.2 (2003)
María Jesús Lamarca Lapuente. Hipertexto: El nuevo concepto de documento
en la cultura de la imagen.
http://www.hipertexto.info/documentos/document.htm
Mela Bosch. “La indización asistida para el manejo de conocimiento en
organizaciones frente al tratamiento documental en bibliotecas.” En: Biblios.
Año 7, No.23, Ene – Mar. 2006
María Texia Iglesias Maturana. "Guía para la preparación de resúmenes". En:
Serie bbliotecología y gestión de información, Nº 41, octubre 2008


Cortesía: Oscar Meneses

Sobre la oración gramática




Oración (gramática)

Árbol sintáctico, para una oración compuesta (el niño que me saludó me odia) en la que la oración subordinada es una oración de relativo.
La oración es el constituyente sintáctico más pequeño posible, capaz de realizar un enunciado o expresar el contenido de una proposición lógica, un mandato, una petición, una pregunta o, en general, un acto ilocutivo que incluya algún tipo de predicación. Se diferencia de las frases en su completitud descriptiva. A veces se usa el término cláusula para designar un constituyente sintáctico con estructura oracional, pero dependiente sintácticamente de otra unidad mayor careciendo también de independencia semántica, o fonológica. Esta falta de autonomía es la principal referencia respecto de la oración, unidad completa e independiente, ya que necesita relacionarse con otras cláusulas dentro de la oración principal.
Una definición tradicional es: «La oración es la palabra o conjunto de palabras qué tiene sentido completo y autonomía sintáctica» que aunque es imprecisa, trata de reflejar el hecho de que la oración pragmáticamente es el fragmento más pequeño del discurso que comunica una idea completa y posee independencia (es decir, podría sacarse del contexto y seguir comunicando). Debe tenerse presente que técnicamente los términos enunciado, proposición y oración no son sinónimos, ya que el primero se refiere a aspectos pragmáticos, el segundo lógicos y semánticos y el último puramente gramaticales. Fonológicamente las oraciones están delimitadas prosódicamente por pausas y gráficamente por comas o puntos. En las escuelas formalistas, es la unidad de análisis fundamental.
Contenido
Introducción
Copia digital de la primera oración húngara conocida. Manuscrito de 1055 de Tihany.
El concepto de «oración» es paradójicamente uno de los que más revisiones ha sufrido en los modelos gramaticales desde la aparición de la lingüística moderna y en particular la moderna teoría de la sintaxis. Tradicionalmente los gramáticos trataron la oración como una unión de "sujeto + predicado"
pero ese análisis semánticamente simplista ha sido abandonado en sintaxis moderna, entre otras cosas porque no aclara la estructura interna, no permite hacer generalizaciones interesantes y parece ignorar las evidencias que llevaron a la hipótesis de endocentricidad generalizada. Además el esquema "sujeto + predicado" no puede explicar oraciones interrogativas como:
(1) ¿Qué se ha comprado María esta tarde?
Porque en ella la estructura claramente es más complicada, y el sujeto está rodeado de constituyentes sintácticos que la gramática tradicional considera parte del predicado. Tampoco la relación entre una oración en voz activa y en voz pasiva queda capturada por una atribución convencional al sujeto y al predicado:
(2a) [Juan] [besó [a María]]
(2b) [María] [fue besada [(por Juan)]]
El análisis sujeto predicado simple no puede aclarar porqué en (2a) María es parte del predicado, pero en la oración (2b) que tienen el mismo contenido proposicional es el sujeto, sin recurrir a argumentos circulares.
Los primeros análisis sintácticos en términos de constituyentes inmediatos de Leonard Bloomfield trataron la oración como una construcción exocéntrica en la que ninguno de los dos constituyentes básicos en sintagma nominal sujeto y la frase verbal eran el núcleo principal de la misma, y ambos digamos constituían elementos jerárquicos del mismo nivel. En el modelo de Noam Chomsky de 1986[1] por el contrario el sujeto se trataba como el especificador de un sintagma de tiempo:
Este sintagma de tiempo sería una categoría funcional cuyo núcleo sería la inflexión de tiempo normalmente asociada a un verbo léxicoconjugado a un [verbo auxiliar]. Además este análisis respalda la hipótesis de endocentricidad generalizada.
En cambio en el análisis del funcionalismo lingüístico no existe una definición formal de oración, sino que existen patrones recurrentes fonológicos, sintácticos y semánticos que permiten definir prototipos de oración, ver más abajo.
Enfoque funcional de oración
En gramática tradicional, las categorías gramaticales eran vistas como unidades discretas. Esto implica dos cosas fundamentales: las categorías poseen límites precisos, o sea, un elemento pertenece a una categoría si posee las propiedades o características que definen a esta como tal, y, debido a esto mismo, los miembros de una categoría son equivalentes entre sí.
Sin embargo, el funcionalismo lingüístico entiende la oración como un continuum dentro del cual una serie de rasgos o propiedades, cuyo fin es identificar no la pertenencia sino la gradación, confluyen y tienden a coincidir según una determinada probabilidad. Esto provoca que dentro de una categoría existen miembros que pueden llegar a ser mejores ejemplos que otros a los cuales se les llama prototipos.
De esta manera, para establecer la definición de la oración, se propone una caracterización de su prototipo y no un conjunto de condiciones necesarias y suficientes para identificarla. Los principales aspectos que se toman en cuenta para definir el ámbito de la oración son los siguientes:
  • Desde el punto de vista de la entonación, está delimitado por dos pausas (una al inicio y otra al final).
  • Desde el punto de vista semántico, transmite un mensaje con sentido cabal para un determinado contexto, o sea, no precisa nada más para ser interpretada.
  • Desde el punto de vista sintáctico, es autónoma. Esto significa que la oración no está incluida dentro de otra unidad gramatical. También es importante señalar que toda oración posee un verbo conjugado.
Enfoque generativista de oración
El análisis de la estructura interna de las oraciones que ha hecho la escuela generativista ha ido variando con el tiempo desde las "reglas de reescritura sintagmática" en que la oración se analizaba como una construcción exocéntrica en la que se unen un sintagma nominal, que en esencia se comportaba como un sujeto, con un sintagma verbal, y sobre los que luego más tarde actuaban desplazamientos sintácticos, pasándose de una estructura profunda a una estructura superficial. A la hipótesis de "endocentricidad generalizada" que trataba en pie de igualdad las categorías funcionales y las léxicas. En este modelo se presupone que las oraciones en esencia se ajustan al esquema estructural:
Esquema de una oración maximal, modelizada como sintagma de tiempo con la estructura ampliada para el complementador.
SC(complementador) [=O']
 /  \
SX  C'
   / \
CºST(tiempo) [=O]
     / \
    SN  T'
       / \
  SV
Donde SN sería en sintagma nominal sujeto, Cº la partícula que introduce una oración que podría no existir,[2] SX sería un especificador del sintagma complementante (en las oraciones interrogativasparicales estará ocupadado por el pronombre interrogativo y su complemento). Tº sería un verbo auxiliar o un verbo en forma finita (que aparece sólo en algunas oraciones), SV el sintagma verbal que en la gramática tradicional se identificaba con el predicado. Cada uno de estos sintagmas constituyentes además podía tener su propia estructura interna.
Cláusulas, oraciones, enunciados y proposiciones
Los términos oración, cláusula, enunciado y proposición son usados informalmente como sinónimos, aunque conviene usar cada término para un conjunto de aspectos diferentes. En principio, el término proposición se refiere al contenido lógico-semántico de una oración, aunque el uso del término es usado de manera ligeramente diferente por diferentes autores. El término enunciado se refiere a una unidad pragmática, que frecuentemente coincide con el contenido oración sintáctica, pero no siempre. Los términos oración y cláusula se usan con un sentido eminentemente gramatical, siendo esencialmente sinónimos. Ocasionalmente cláusula es más usado para referirse a una oración que forma parte de una oración compuesta más grande.
En algunas gramáticas se prefiere el término oración transpuesta dentro de una oración compleja, antes que hablar de oración principal o de oraciones subordinadas.[3] Otros incluso prefieren hablar de oraciones subordinadas inyectadas o incrustadas, si bien en estas no incluyen a las oraciones comparativas ni a las que establecen una relación de causa y consecuencia.[4]
Clasificación de las oraciones
En gramática tradicional es común clasificar las oraciones se pueden clasificar atendiendo a criterios sintácticos, semánticos y pragmáticos.
Criterios sintácticos
La gramática tradicional trata las oraciones desde un punto de vista de componentes inmediatos:
  • Oraciones compuestas: son las que dos o más oraciones forman otra oración; por ejemplo: A Carlos le gusta jugar fútbol, pero a María solo le gusta jugar cricket.
  • Oraciones copulativas (o atributivas): aquellas que cuentan con un predicado nominal. Éstos constan de un verbo que hace de cópula entre el sujeto y el atributo.
  • Oraciones adversativas: aquellas que van precedidas por una conjunción adversativa (pero, sino, aunque, no obstante, mas, sino que). Contradicen el significado de la oración a la que se unen por la susodicha conjunción. (Ej.: Tú lo sabes, pero yo no).
  • Oraciones disyuntivas: aquellas que van precedidas por una conjunción disyuntiva (o, u). Contradicen o matizan el significado de la oración a la que se unen por la susodicha conjunción.
  • Oraciones subordinadas: Aquellas oraciones que hacen parte de otra principal y desempeñan en ella la función que realiza otra palabra, ya sea de sustantivo,adjetivo o adverbio. Tradicionalmente, estas oraciones se han denominado subordinadas y principal a la oración de la que forma parte. Las oraciones subordinadas carecen, por sí solas de significación y se ligan a las principales mediante conjunciones subordinantes.
Este enfoque difiere grandemente de los enfoques más formales, y en cierto modo más aplicables a la generalidad de lenguas del mundo. En estos enfoques lo más importante no es la cualidad de los elementos de unión en las oraciones compuestas sino el tipo de estructura jerárquica que se da entre las diversas partes de dicha oración.
Según la divisibilidad
Dentro del enfoque funcionalista las oraciones se clasifican en oraciones unimembres y oraciones bimembres. Las primeras se llaman a veces también predicados directos no se pueden dividir en sujeto-predicado, sino que tienen su propia categorización según el tipo de información que comunican. Las interjecciones, las exclamaciones, los vocativos, las respuestas a preguntas o los imperativos desnudos son oraciones unimembres por ejemplo. En cambio en el análisis generativista este tipo de actos de habla no se considera que tengan estructura sintáctica.
Las oraciones bimembres son aquellas que poseen dos miembros (o constituyentes sintácticos) y por lo tanto, pueden ser analizadas estructuralmente según sus partes. Se reconocen dos grandes grupos: las oraciones bimembres averbales y las verbales u orales:
  • Oración bimembre averbal. No poseen verbos conjugados (los verboides, o "tiempos no personales del verbo" - gerundio, participio e infinitivo - no son parte del paradigma de conjugación) y se componen de dos partes: el soporte y el aporte. Desde un punto de vista generativo son oraciones que no tienen estructura de sintagma de tiempo. Algunos ejemplos:
NovakDjokovic, número uno del mundo.
Robin Williams, premiado por la Academia.
Flor Violeta, la más hermosa del mundo.
La selección de fútbol, muy cerca del triunfo.
En peligro víctimas de choque.
  • Oración bimembre verbal. En cierto modo este es el prototipo de oración, con un verbo flexionado según el tiempo. Tradicionalmente se consideran formadas por un sujeto y un predicado; o según el análisis generativo son un sintagma de tiempo con el sujeto ocupando la posición de especificador del mismo y el verbo flexionado la posición de núcleo oracional.
Oraciones según la forma del sujeto
Según el tipo de sintagma nominal que hace de sujeto las oraciones se pueden clasificar en:
  • Oraciones personales explícitas, en las que existe un sintagma nominal fonéticamente realizado que es sujeto de la oración.
  • Oraciones personales implícitas o elípticas. En la que no aparece ningún sujeto explícitamente, y se analizan comúnmente como casos de sujeto elíptico.
  • Oraciones impersonales, en las que no existe sujeto explícito ni implícito. Normalmente se refiere a oraciones que expresan situaciones atmosféricas (llueve, hace frío, ...), existenciales (hay comida), para las que no existe un referente que pudiera ser interpretado como sujeto semántico de la oración. Y las impersonales (pseudo)reflejas del tipo aquí se vive bien tiene sujeto...
Oraciones según la complejidad del predicado
Según la forma del sintagma verbal o en particular el número de verbos flexionados las oraciones se pueden clasificar en simples o compuestas:
  • Oraciones simples,tradicionalmente analizadas como formadas por un único predicado. Desde el punto de vista generativa contienen un único núcleo de inflexión o de tiempo.
  • Oraciones compuestas, en las que existe más de un verbo conjugado, y en las que por tanto alguno de los constituyentes sintácticos, es una oración subordinada o sintagma temporal que a su vez es parte del sintagma temporal mayor que constituye la oración compuesta completa.
Una oración subordinada (o secundaria) es una oración que depende de la proposición principal. Es decir, la oración subordinada es una oración que es a su vez un constituyente sintáctico de otro sintagma que no es oración. Y por tanto, la oración subordinada no tiene una autonomía sintáctica (si es considerada sola) y es "subordinada" por otra, siendo locuciones adverbiales o conjunciones. La oración subordinada puede ser explícita (verbo conjugado en un modo definido) o implícita (el verbo está conjugado en un modo indefinido).
Coordinación o parataxis
Las oraciones coordinadas tienen relación de igualdad jerárquica, es decir, están en el mismo del árbol sintáctico. Se puede decir que son dos oraciones que se han unido en condición de igualdad, manteniendo su estatus la una respecto de la otra. Las oraciones formadas por dos o más oraciones simples coordinadas se conocen como oraciones compuestas por coordinación (especificando además el tipo de esta coordinación, que viene marcado por el nexo, pudiendo ser de todos los tipos que se muestra en los ejemplos. El nexo de este tipo de coordinación se conoce como conjunción.
Algunos ejemplos de oraciones compuestas fomradas por coordinación:
  • Oración coordinada copulativa: Juan fue al mercado y Helena se marchó a trabajar.
  • Oración coordinada disyuntiva: Paola irá de vacaciones a Roma o bien visitará a su familia.
  • Oración coordinada adversativa: Afortunadamente, nuestro tío no vino, sino que volvió.
  • Oración coordinada distributiva: Ya descansa en la cama, ya descansa en el sofá.
  • Oración coordinada explicativa: El rector siempre tiene razón, es decir, siempre me convence.
Subordinación o hipotaxis
Las oraciones subordinadas establecen una relación de dependencia respecto de otra oración, es decir, jerárquicamente están dominadas por otra oración llamada oración principal. Las oraciones formadas por una oración principal y una o más oraciones subordinadas se conocen como oraciones complejas u oraciones compuestas por subordinación (especificando además el tipo de esta, que viene también marcado por el nexo), pudiendo ser de todos los tipos que se muestra en los ejemplos:
  • Oración principal, tipo de oración de la que depende una oración subordinada, del tipo que sea. Estas proposiciones si se encontraran sin nexos serían oraciones autónomas y completas. Ejemplo:
Trajo todas las referencias para completar el artículo en cuanto hubo terminado el texto principal.
  • Oración subordinada sustantiva, tipo de oración subordinada por una conjunción subordinante y con las funciones propias del sustantivo respecto de la oración principal (sujeto, objeto...):
Que participe el público es importante. (En este ejemplo, la oración subordinada ejerce de sujeto dentro de una oración atributiva o copulativa).
El bibliotecario no permite que los vándalos editen ese artículo. (En este otro, la oración subordinada ejerce de objeto directo).
Ramón, que es americano, ha viajado mucho. (Oración subordinada adjetiva explicativa).
Los editores que protegen los artículos no tienen miles de ojos. (Oración subordinada adjetiva especificativa).
  • Oración subordinada adverbial, tipo de oración subordinada introducida por un adverbio o nexo adverbial:
Hizo todas sus oraciones donde tú le indicaste. (Oración subordinada adverbial local (o de lugar)).
El experto no duda en opinar cuando se le pide. (Oración subordinada adverbial temporal (o de tiempo)).
Hago las cosas como mejor sé. (Oración subordinada adverbial modal (o de modo).)
No tengo que revisarlo si ya lo ha hecho otro. (Oración subordinada adverbial condicional.)
Criterios pragmáticos: Oraciones según la fuerza ilocutiva
Según la fuerza ilocutiva o posibilidad de asignarles un valor de verdad:
  • Enunciativas o declarativas, a las que en general puede dotárseles de un valor de verdad y que a su vez se dividen según contengan elementos de negación o no en afirmativas y negativas.
  • Exhortativas o imperativas, que en general no tienen un valor de verdad asignable ya que no reflejan un estado de hechos. Las oraciones exhortativas también se conocen como oraciones imperativas. Este tipo de oraciones expresan un consejo, ruego, mandato o prohibición. Los indicadores de la modalidad en este tipo de oraciones es el uso de las formas verbales en imperativo y en subjuntivo. Un ejemplo de esta oración es: "¡Escuchad esta noticia!"
  • Exclamativas, tampoco tienen un valor de verdad y tienen una finalidad expresiva, y en lenguas indoeuropeas frecuentemente son introducidas por un complementador. El hablante suele expresar sus sentimientos de alegría, dolor, admiración, sorpresa,etc... es decir, expresa afectividad, manifiestan una emoción. El indicador de modalidad que interviene en estos tipos de oraciones es la entonación. Ésta nos ayuda a distinguir la oración exclamativa del resto de oraciones. Siempre va con signos de exclamación, por ejemplo: "¡Que bonito día hizo ayer!"
  • Interrogativas, las oraciones interrogativas no tienen valor de verdad sino que sirven para pedir información. En las lenguas indoeuropeas es frecuente que empiecen con un interrogativo de tipo pronominal dislocado al principio de la frase e inviertan el orden del sujeto y el verbo (¿Qué está diciendo ese hombre en voz alta?). Algunas oraciones interrogativas (de respuesta sí/no) no tienen palabra interrogativa al principio pero sí tienen inversión (¿Ya sabe Pedro lo que ha pasado?).
  • Dubitativas, estas oraciones expresan una suposición o probabilidad.Los indicadores de modalidad de estas oraciones son el uso de los verbos en futuro de indicativo o en condicional. Un ejemplo de este tipo de oraciones: Sería una chica muy tranquila.
  • Optativa o desiderativa: Las oraciones optativas también se pueden llamar desiderativas. Expresan un deseo y a veces se pueden pronunciar en forma exclamativa. Los indicadores de la modalidad que podemos identificar en este tipo de oraciones es el uso de los tiempos verbales en subjuntivo. También es habitual utilizar la interjección "OJALÁ" como otro indicador de la modalidad. Un ejemplo de oración optativa es: "¡Ojalá eso que me han contado no sea verdad!"
Oraciones según el tipo de verbo (morfología, semántica)
Según lo dicho (Qué es lo dicho), o también el tipo de verbo (más concretamente su semántica o bien su morfología):
  • Oración copulativa (o atributiva), si el predicado es nominal. Éstos constan de un verbo que hace de cópula entre el sujeto y el atributo.
  • Oración predicativa, con predicado verbal, es decir, con un verbo que no es copulativo. Los predicados verbales pueden, a su vez, dividirse en:
    • Transitivas o intransitivas, dependiendo de si llevan complemento directo o no, respectivamente.
    • Reflexivas, si es el sujeto quien realiza y recibe la acción del verbo.
    • Recíprocas, en las que los sujetos se intercambian la acción.
    • Personales o impersonales: las personales poseen sujeto. Las impersonales, no. El verbo en las impersonales se encuentra en tercera persona del singular. Hay tres grupos de oraciones impersonales:
      • Con verbos meteorológicos ("llover", "granizar").
      • Con verbos como "haber", "hacer", "ser", "sobrar con", "bastar con"...
      • Con "se", que es una marca de impersonalidad. No confundir con el pronombre personal de tercera persona.
¡Atención!No confundir las oraciones impersonales con las formas no personales de un verbo (infinitivo, gerundio y participio)
    • Activas o pasivas (en las lenguas ergativas no existe generalmente voz pasiva sino la llamada antipasiva). Por otra parte, en español hay dos tipos de pasivas:
      • Pasivas propiamente dichas: que cuentan con un sujeto paciente y el verbo (el núcleo del predicado) está en voz pasiva. Pueden tener opcionalmente un complemento agente, aunque este puede no aparecer. Ejemplo de oración pasiva: "Los alumnos fueron recibidos amablemente por sus profesores" que tiene sujeto paciente (los alumnos) que recibe la acción indicada por el verbo (recibir) y un complemento circunstancial agente (por sus profesores) que corresponde a quien o quienes realizan la acción del verbo en pasiva.
      • Pasivas reflejas o pasivas con morfema de pasividad SE: Estas oraciones se caracterizan por tener un sujeto inanimado paciente, carecen de complemento agente, el verbo (núcleo del predicado) tiene una forma propia de la voz activa. Necesariamente usan el morfema "se" como marca de pasiva refleja y además el verbo está en tercera persona. Ejemplo: Se entregaron los resultados oportunamente. En esta oración, apreciamos por el método de la concordancia que el sujeto oracional corresponde al sintagma los resultados. Éste es de carácter paciente, ya que recibe la acción indicada por el verbo en voz activa(entregar) y observamos la presencia del morfema se. No hay C. C.
Conviene tener presente que:
  • En algunas lenguas los verbos transitivos y los intransitivos tienen marcas morfológicas explícitas y, por tanto, en esas lenguas la transitividad puede ser una categoría expresada morfológicamente.
  • Muchas lenguas carecen propiamente de verbo copulativo por lo que en ellas, las oraciones copulativas de las lenguas europeas se traducen por un sujeto yuxtapuesto a su atributo (generalmente otro nombre) sin verbo copulativo de por medio. Por esa razón desde una perspectiva translingüística sería más adecuado hablar de predicación nominal, más que de oraciones copulativas.
  • En muchas lenguas pueden existir voces gramaticales diferentes de la activa y la pasiva, siendo las más frecuentes la antipasiva, la causativa o la aplicativa.


Predicado verbal

Se denomina predicado verbal a la clase de función sintácticapredicado del sintagma verbal cuyo núcleo no es verbo copulativo ni puede ser reemplazado por verbo copulativo, es un verbo predicativo.
Semánticamente, esto es, por significado, su cometido es comentar un sujeto o incrementar la información sobre él instalándolo en el mundo y sus coordenadas, accidentes y circunstancias.
Existen varios tipos de predicado verbal; según el papel que el sujeto represente respecto a él, puede ser predicado verbal activo (cuando el sujeto es agente, hace cosas o las preside) o predicado verbal pasivo (cuando el sujeto es paciente, recibe la acción que ejecuta un complemento agente en una construcción pasiva)
El predicado verbal activo puede ser a su vez transitivo si posee objeto directo, o intransitivo si no lo posee.

Verbo copulativo

El verbo copulativo (del latíncopŭla 'lazo' o 'vínculo') es un tipo de verbo que poseen algunas lenguas para construir lo que es llamado predicación nominal, en que se identifica a un sujeto oracional como miembro de una clase semántica dada por un complemento atributo (e.g. mi padre es médico). Aunque no suele expresar de por sí una acción o condición, sirve para igualar o asociar el sujeto con el predicado. Los verbos copulativos son: ser, estar, semejar, resultar, parecer.
Estrictamente los verbos copulativos no contribuyen al significado semántico de la oración. Los verbos pseudocopulativos son similares, aunque no son semánticamente vacíos su contribución es sólo de tipo aspectual y no propiamente léxica.

Verbo predicativo

El verbo predicativo expresa un significado que por lo general denota acción, ya sea concreta (física o que se ejecuta con un cuerpo: "Pedro corta leña"; "La cosechadora arranca espigas") o abstracta (proceso: Pedro piensa o estudia matemáticas).
Los verbos predicativos pueden dividirse en transitivos o intransitivos. Los transitivos proyectan su acción sobre un complemento u objeto directo que es modificado o alterado por ellos: "Pedro come peras". Los intransitivos, no: la acción no sale del sujeto ni se proyecta fuera del verbo: "Pedro come". Como se ve en estos ejemplos, un mismo verbo puede tener usos transitivos o intransitivos según tenga o no tenga objeto directo. Sin embargo hay verbos que sólo pueden ser exclusivamente transitivos o exclusivamente intransitivos. Exclusivamente transitivo es, por ejemplo, el verbo decir: "Pedro dice..." necesariamente necesita un complemento directo (porque, si no, Pedro estaría mudo). Exclusivamente intransitivos son, por lo general, los verbos que indican estado: "Pedro ha muerto" (no podremos decir que "Pedro ha muerto su muerte"). Otros ejemplos de verbos intransitivos: "Pedro enferma" (no podemos decir que "Pedro enferma una enfermedad"); "Pedro brinca" (no podemos decir que "Pedro brinca obstáculos"; sí, en cambio, que da saltos o salta obstáculos, pues dar y saltar son verbos transitivos).

Yuxtaposición (gramática)

En gramática, la yuxtaposición es, junto a la coordinación y la subordinación, una de las tres clases de procedimientos para combinar oraciones o nexos en el lenguaje, e indicar relaciones sintácticas entre ellas [1] .
A diferencia de los otros procedimientos, la yuxtaposición no utiliza nexos, sino pausas o signos gráficos de puntuación en la lengua escrita para relacionar dos proposiciones. Eso hace que con frecuencia sea ambigua y dé lugar a interpretaciones sintácticas distintas entre un hablante u otro si el contexto no está suficientemente claro o las presuposiciones no son muy explícitas.

Coordinación (gramática)

La coordinación es, junto a la subordinación y la yuxtaposición, uno de los tres procedimientos de que se vale el lenguaje para unir dos palabras, sintagmas o proposiciones entre sí.
A diferencia de la yuxtaposición, la coordinación no utiliza pausas representadas en la ortografía por puntos, comas y otros signos ortográficos, sino que utiliza nexos, y, a diferencia de la subordinación, una de las proposiciones no domina sobre la otra y posee una jerarquía superior, sino que ambas proposiciones poseen tan similar importancia que son de hecho intercambiables sin que se modifique en absoluto el significado global de la oración compuesta que forman. Por ejemplo, si decimos:
Guillermo lava (y, o, pero) María cocina
Decimos exactamente lo mismo que si invertimos el orden de las proposiciones:
María cocina (y, o, pero) Guillermo lava.
Además, las proposiciones coordinadas poseen cierta autonomía, de forma que si se separan ambas poseen sentido completo, lo cual no sucede en el caso de las proposiciones subordinadas:
Guillermo lava.
María cocina.

Subordinación

En lingüística, la subordinación o hipotaxis es un tipo de relación sintáctica entre diferentes constituyentes sintácticos. Un constituyente sintáctico A está subordinado a otro elemento B si, A es parte de B, o en términos de árboles sintácticos, si el nudo correspondiente a A está dominado por el nudo correspondiente a B.
Usualmente se aplica para describir la relación existente entre una oración subordinada y una oración principal. El procedimiento contrasta con la coordinación de elementos sintácticos en que los dos elementos jerárquicamente están al mismo nivel.

Oraciones subordinadas

La subordinación o hipotaxis de oraciones una relación entre dos oraciones según la cual una (la denominada oración principal) posee mayor jerarquía que la otra (denominada oración subordinada) de forma tal que no son permutables la una por la otra sin que el significado varíe o se torne agramatical. Técnicamente debería decirse que la relación de subordinación se da entre los núcleos sintácticos de ambas oraciones, ya que usualmente la oración subordianada de hecho es parte de la oración principal (en cambio el núcleo subordinado no es parte del núcleo principal). Estructuralmente la definción de subordinación es más clara, el núcleo de la oración subordianda está dominado jerárquicamente por el nodo raíz de la oración principal.
Un ejemplo de oración compleja en la que existe subordinación es:
(1a) Mentiría si lo afirmase
Que no admite la permutación de núcleos, ya que esa operación da lugar a una oración agramatical:
(1b)*Afirmase si lo mentiría.
Esto contrasta con muchas oraciones en las que existe coordinación donde en general la permutación de núcleos conduce a oraciones gramaticales (aunque no necesariamente con el mismo significado):
Leo y estudio todos los días
Estudio y leo todos los días
Las relaciones de subordinación suelen marcarse mediante unos nexos específicos, pero estos pueden omitirse mediante la llamada yuxtaposición: "Pedro no vino porque estaba cansado" puede decirse también omitiendo el nexo y sustituyéndolo por un punto: "Pedro no vino. Estaba cansado"


 Fuente: Wikipedia