Entradas etiquetadas programas

Cómo indexar un sitio web con dtsearch

Una de las herramientas más versátiles de los traductores son los indexadores de documentos, se emplean para encontrar ocurrencias de palabras o frases en contextos específicos. Dtsearch permite no sólo indexar los documentos sino también incluirlos en el índice. Esta característica viene muy bien para utilizar los índices sin tener acceso a los documentos originales. Esta situación es muy común, por ejemplo, cuando viajamos o no tenemos acceso a la web por las circunstancias que sean.

A continuación explico cómo puedes indexar unas páginas de internet con dtsearch:
1º Selecciona Create index(advanced)

2º En la ventana que aparece escribe el nombre que quieres dar al índice (en el ejemplo prueba). Es importante que en las opciones del índice marques “Cache document text in the index” y “Cache text in the index”

3º Cuando crees el índice la aplicación te preguntará si deseas modificarlo. Responde que sí y te saldrá la siguiente pantalla donde deberás hacer clic sobre “Add web..”

4º Te aparecerá la siguiente pantalla donde he puesto como ejemplo indexar mí página con una profundidad de dos niveles. Aquí deberás indicar la dirección de las páginas que quieres indexar y “crawl depth”. Te recomiendo que empieces con números bajos sino el índice puede crecer demasiado. En el ejemplo he limitado el tamaño de los documentos a indexar (los de más de 8 Mb no se indexarán) y no permito que el agente de indexación busque páginas fuera del servidor de las páginas que estoy indexando.

5º Cuando acabe la indexación aparecerá una pantalla como la siguiente que indica que se ha completado con éxito.

 

 

Dejar un comentario

Oracle y la inteligencia empresarial

Lo principal que nos ofrece Oracle es, como no, su base de datos. Fiable, rápida, escalable, eficiente, segura y otros calificativos que mucha gente reconoce. Se puede configurar como datawarehouse (almacén de datos) y lo más destacable es que instalando la “Oracle OLAP option”, disponible desde la versión 9 de la BBDD, puede contener tanto tablas relacionales como cubos multidimensionales.

Esta característica aporta gran flexibilidad a la hora de diseñar el almacén de los datos y evita la necesidad de tener bases de datos diferentes para los datos relacionales y los datos multidimensionales, simplificando el mantenimiento, y de tener personal especializado en cada una de ellas. Al seguir siendo la misma base de datos de siempre sus administradores no tienen ningún problema en llevar a cabo su función. También se obtiene una mayor flexibilidad de acceso a los datos: se puede acceder a los cubos mediante el OLAP API que se suministra o a las vistas o tablas relacionales sobre las que se construyen los mismos. De esta manera se amplía el número de herramientas que podemos utilizar.

Para crear el almacén de datos disponemos de dos herramientas, Warehouse Builder y Analytic Workspace Manager. Para la primera de ellas, si hemos instalado la Enterprise Edition de la BBDD, se pueden instalar conectores con los siguientes paquetes de gestión: E-business suite de Oracle, Peoplesoft, SAP R/3 y Siebel.
Una vez que tenemos los datos almacenados, necesitamos aplicaciones para aprovecharlos. Con este fin Oracle nos proporciona, por una parte, Oracle Business Intelligence Beans para desarrollos a medida, y por otra, aplicaciones de consulta y análisis de los datos, Oracle Business Intelligence Discoverer plus OLAP, Oracle Business Intelligence Spreadsheet Add-In, que acceden directamente a los cubos mediante el OLAP API, y Oracle Business Intelligence Publisher, Oracle HTML database, Oracle Aplication Express, Oracle Reports que pueden acceder a las tablas relacionales sobre las que se construyen los cubos.

Además de todo lo dicho, Oracle comercializa tres soluciones distintas de BI:
Oracle BI Standard Edition (Oracle BI Discoverer, Oracle BI Spreadsheet Add-in, Oracle BI Beans, Oracle Reports Services),
Oracle BI Standard Edition One, que incluye,
Oracle BI Server: modelo de negocio de la empresa y capa de abstracción
Oracle BI Publisher (antes XML Publisher): Informes configurables hasta el pixel
Oracle BI Answers: Consultas e informes
Oracle BI Interactive Dashboards: Cuadros de mando interactivos

que se puede ampliar si fuera necesario a

Oracle BI Suite Enterprise Edition Plus, la más completa que incluye además:
Oracle BI Delivers: Vigilancia y alertas proactivas de la actividad de la empresa
Oracle BI Disconnected Analytics: Análisis para los profesionales móviles
Oracle BI Briefing Books: Copias de las páginas del cuadro de mando para ver y compartir sin estar conectados
Hyperion Interactive Reporting: Informes interactivos e intuitivos
Hyperion SQR Production Reporting: Generación de informes masivos de gran calidad
Hyperion Financial Reporting: Generación de informes de gestión y financieros
Hyperion Web Analysis: Análisis, presentación e informes OLAP

Dejar un comentario

¿Qué puede hacer PALO por ti?

Primero necesitas saber qué es PALO. Es una herramienta OLAP, como podrías haber adivinado con la ayuda de un espejo. Pero si sigues sin saber que significa OLAP después de haberte estudiado la entrada de wikipedia, no desesperes, no es necesario saberlo.
De momento sólo deberías seguir leyendo si tienes interés por los números, si eres de los que manejas muchos números y tienes que hacer muchas operaciones con ellos.
A menos que estés utilizando una aplicación específica para tu necesidad supongo que te habrás ayudado de hojas de cálculo y tendrás guardado estos números en las propias hojas o incluso en varias bases de datos. Pero a medida que pasa el tiempo (para algunos meses, para otros años) estos datos se multiplican exponencialmente y son difíciles de recuperar y comparar. Es la hora de agruparlos y ordenarlos. Mejor hubiera sido tenerlos ordenados desde el principio pero, como todo lo que cuesta, lo dejamos hasta que los inconvenientes que se generan superan los esfuerzos por poner orden.
La manera de lograrlo es creando una base de datos orientada a tus necesidades de cálculo. Aquí es donde viene PALO en tu ayuda, sobre todo si tienes tu cerebro cuadriculado en hojas de cálculo (de dos dimensiones). Pero antes tienes que añadir otra dimensión a tu cerebro, al igual que tuvieron que hacer los habitantes de la Tierra cuando descubrieron que el mundo era tridimensional y no plano. Y cuando lo hayas conseguido, añadir otra más, que podría ser el tiempo en la vida real. Este ejercicio se podría continuar hasta n dimensiones que son las que maneja PALO sin problemas (cubos multidimensionales). Esta es la parte más delicada del proceso, el cómo organizar los datos en dimensiones que sean significativas. Pero una vez que están organizados, los informes y cálculos salen solos, basta con fijar todas las dimensiones menos dos para crear una tabla de dos dimensiones, que es a lo que están acostumbrados los habitantes de las hojas de cálculo y de los informes impresos o en pantalla.
¿Qué es lo que hace especial a PALO del resto de las herramientas OLAP?
La combinación de su carácter gratuito con la inclusión de una base de datos que no requiere apenas mantenimiento y de un conector para utilizarlo desde Excel. Para los más apañados, también es posible integrar los informes en la web.
¿Dónde conseguirlo?
En las páginas de Jedox
¿Quieres ayuda? Si la ayuda y documentación que encuentras te resulta insuficiente puedes solicitar la ayuda de un profesional, por ejemplo yo.

Comentarios (1)