Grupo de Pesquisa:Ciência De Dados - CEFET/RJ

Total de projetos de pesquisa


Número total de itens: 82

2018

1.   2018-Atual. Gerência e Análise de Séries Espaço-Temporais: Métodos Aplicações
Descrição: Processo: E-26/203.239/2017, Programa: Jovem Cientista do Nosso Estado (JCNE), Valor financiado: R$75.600,00. O tratamento do dilúvio de dados que vêm sendo produzido pelas ciências, corporações e por bilhões de usuários de serviços de Internet globais se apresenta como um dos grandes desafios para a atual sociedade do conhecimento. A necessidade de gerência, análise e extração de conhecimento a partir desses dados cresce significativamente. Um subconjunto de aplicações relevantes nesse processo engloba o estudo de séries temporais e espaço-temporais. A Mineração de Dados em séries espaço-temporais comumente recai na exploração de métodos de representação, transformação, predição, classificação e padrões frequentes. Para cada método, existem inúmeros algoritmos. A solução de um determinado problema pode envolver a combinação de diferentes métodos e algoritmos. Ademais, diversos fenômenos representados por séries espaço-temporais têm como característica básica a propriedade de não serem estacionários, i.e., diferentes subsequências da série têm as suas médias e variâncias não preservadas. Estas características tornam a Mineração de Dados bem mais complexas. Este projeto de pesquisa visa contribuir para o aumento da eficiência e eficácia das abordagens na gerência e análise de dados de séries espaço-temporais em diferentes aplicações. Para tanto, pretende-se atuar em três frentes: (i) Gerência de dados, (ii) Métodos de pré-processamento e análise de dados, (iii) Aplicações em problemas de predição, classificação e padrões frequentes. A pesquisa combina o estudo aplicado de séries temporais e espaço-temporais em problemas de Mineração de Dados com as pesquisas básicas em gerência e análise de dados visando entender a fundo em quais circunstâncias tais abordagens podem ser refinadas para apoiar a não-estacionariedade. A partir dessa compreensão, será possível investir com propriedade na resolução de problemas reais propostos para cenários de predição, classificação e padrões frequentes em séries espaço-temporais não-estacionárias.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Eduardo Soares Ogasawara - Coordenador. Financiador(es): Centro Federal de Educação Tecnológica Celso Suckow da Fonseca - Bolsa.
Membro: Eduardo Soares Ogasawara.

2017

1.   2017-Atual. Análise de padrões do Instituto de Educação Executiva - FGV \ IDE
Descrição: Análise dos padrões socioeconômicos, geográficos, demográficos e escolares dos alunos dos cursos de MBA da Fundação Getulio Vargas, com vistas à caracterização do público, melhoria de oferta de produtos, otimização de cursos e disciplinas e criação de sistemas de recomendação. Através de técnicas de Machine Learning e de Processamento de Linguagem Natural são exploradas as informações do SIGA - Sistema Integrado de Gestão Acadêmica e gerados insights para alimentar os coordenadores educacionais do IDE/FGV. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (1) . Integrantes: Eduardo Fonseca Mendes - Coordenador / Renato Rocha Souza - Integrante.
Membro: Eduardo Fonseca Mendes.
2.   2017-Atual. Combatendo Corrupção com Dados Abertos
Descrição: Este projeto busca analisar como técnicas de processamento e análise de grande volume de dados públicos podem ser utilizadas para promover e ampliar a capacidade institucional de watch dogs (i.e. Ministério Público e Tribunais de Contas) de identificar padrões indicativos de risco de corrupção ou outras irregularidades em compras públicas municipais. O primeiro passo é a construção de bases de dados analíticas, tendo como fonte bases de dados publicamente disponibilizadas pelo Governo Federal, Estados e Municípios. Em seguida partiremos para construção de métricas e indicadores de irregularidades, baseados em experiência internacional, mas infelizmente obscuros e não necessariamente replicáveis na realidade Brasileira. Consequentemente, o presente projeto reestrutura e reinventa algumas das principais lições da literatura internacional sobre utilização de dados para identificar punir e prevenir corrupção e irregularidades em compras públicas, para adequá-las ao contexto brasileiro, utilizando indicadores compatíveis com a realidade nacional de disponibilidade de dados.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Renato Rocha Souza - Coordenador / Eduardo Fonseca Mendes - Integrante / Rodrigo dos Santos Targino - Integrante / Rafael Braem Velasco - Integrante / Margaret Armstrong - Integrante / Ricardo Lopes - Integrante.
Membro: Renato Rocha Souza.
Descrição: Este projeto busca analisar como técnicas de processamento e análise de grande volume de dados públicos podem ser utilizadas para promover e ampliar a capacidade institucional de watch dogs (i.e. Ministério Público e Tribunais de Contas) de identificar padrões indicativos de risco de corrupção ou outras irregularidades em compras públicas municipais. O primeiro passo é a construção de bases de dados analíticas, tendo como fonte bases de dados publicamente disponibilizadas pelo Governo Federal, Estados e Municípios. Em seguida partiremos para construção de métricas e indicadores de irregularidades, baseados em experiência internacional, mas infelizmente obscuros e não necessariamente replicáveis na realidade Brasileira. Consequentemente, o presente projeto reestrutura e reinventa algumas das principais lições da literatura internacional sobre utilização de dados para identificar punir e prevenir corrupção e irregularidades em compras públicas, para adequá-las ao contexto brasileiro, utilizando indicadores compatíveis com a realidade nacional de disponibilidade de dados.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Eduardo Fonseca Mendes - Coordenador / Renato Rocha Souza - Integrante / Pablo Cerdeira - Integrante / Margaret Armstrong - Integrante / Ricardo Lopes Cardoso - Integrante / Rafael Braem Velasco - Integrante.
Membro: Eduardo Fonseca Mendes.
3.   2017-Atual. Criação de Índices de Preços ao Consumidor baseado em informações da web (IPC-W)
Descrição: Dando continuidade a parceria firmada em setembro de 2014, a Escola de Matemática Aplicada (FGV/EMAp) e o Instituto Brasileiro de Economia (FGV/IBRE) propõem a continuação do projeto ?Proposta de criação de um Índice Espacial de Preços ao Consumidor (IEPC-RJ) por regiões da cidade do Rio de Janeiro?. Durante este projeto todas as metas estabelecidas foram cumpridas, a saber: a) Tratamento dos dados das séries de preços do IBRE; b) construção de banco de dados com extensões espaciais e provisão para o cotejamento com séries de preços online; c) georreferenciamento dos informantes; d) análise de distribuição espacial de informantes; e) análise das séries temporais de preços nas 5 Aps (áreas de planejamento) do Rio de Janeiro e f) prototipação das tecnologias, desenho e automação de processo de filtragem, processamento e visualização de dados em site animado. O processo completo será detalhado no relatório do projeto e os resultados sumarizados em artigo submetido a periódico especializado e disponível em preprint1, ambos anexos. Pretendemos dar continuidade ao projeto através da criação de um índice de preços ao consumidor baseado em dados da web (IPC-W) com dados a serem capturados em uma variedade de sites online, de modo perfazer dimensões análogas aos preços monitorados no IPC-IBRE (alimentos, serviços, bens de consumo, alugueis, etc.). A metodologia proposta para o cálculo é baseada em Cavallo (2013)2. Os potenciais resultados desse projeto são: (a) Criação e divulgação de um índice de preços baseados em dados da web (IPC-W IBRE|EMAp); (b) criação de uma medida que anteceda o IPC e que pode ser atualizada em base diária; (c) desenvolvimento de novas tecnologias de extração de dados, visando ao planejamento de formas alternativas e menos custosas de cálculo do atual IPC e de outros indicadores calculados pelo IBRE.; e (d) artigos acadêmicos. Pretendemos, no escopo deste projeto, e com a experiência adquirida e sinergia alcançada no período do projeto atual em curso, criar um novo centro na FGV: O Data Science Statistics Lab (DSSL | IBRE | EMAp).. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (4) . Integrantes: Renato Rocha Souza - Coordenador / Flavio Codeco Coelho - Integrante / Eduardo Fonseca Mendes - Integrante / Pedro Guilherme Costa Ferreira - Integrante / Vagner Laerte Ardeo - Integrante. Financiador(es): Fundação Getúlio Vargas - Auxílio financeiro.
Membro: Renato Rocha Souza.
Descrição: Dando continuidade a parceria firmada em setembro de 2014, a Escola de Matemática Aplicada (FGV/EMAp) e o Instituto Brasileiro de Economia (FGV/IBRE) propõem a continuação do projeto Proposta de criação de um Índice Espacial de Preços ao Consumidor (IEPC-RJ) por regiões da cidade do Rio de Janeiro. Durante este projeto todas as metas estabelecidas foram cumpridas, a saber: a) Tratamento dos dados das séries de preços do IBRE; b) construção de banco de dados com extensões espaciais e provisão para o cotejamento com séries de preços online; c) georreferenciamento dos informantes; d) análise de distribuição espacial de informantes; e) análise das séries temporais de preços nas 5 Aps (áreas de planejamento) do Rio de Janeiro e f) prototipação das tecnologias, desenho e automação de processo de filtragem, processamento e visualização de dados em site animado. O processo completo será detalhado no relatório do projeto e os resultados sumarizados em artigo submetido a periódico especializado e disponível em preprint1, ambos anexos. Pretendemos dar continuidade ao projeto através da criação de um índice de preços ao consumidor baseado em dados da web (IPC-W) com dados a serem capturados em uma variedade de sites online, de modo perfazer dimensões análogas aos preços monitorados no IPC-IBRE (alimentos, serviços, bens de consumo, alugueis, etc.). A metodologia proposta para o cálculo é baseada em Cavallo (2013)2. Os potenciais resultados desse projeto são: (a) Criação e divulgação de um índice de preços baseados em dados da web (IPC-W IBRE|EMAp); (b) criação de uma medida que anteceda o IPC e que pode ser atualizada em base diária; (c) desenvolvimento de novas tecnologias de extração de dados, visando ao planejamento de formas alternativas e menos custosas de cálculo do atual IPC e de outros indicadores calculados pelo IBRE.; e (d) artigos acadêmicos. Pretendemos, no escopo deste projeto, e com a experiência adquirida e sinergia alcançada no período do projeto atual em curso, criar um novo centro na FGV: O Data Science Statistics Lab (DSSL | IBRE | EMAp).. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (4) . Integrantes: Eduardo Fonseca Mendes - Integrante / Renato Rocha Souza - Coordenador / Flavio Codeco Coelho - Integrante / Pedro Guilherme Costa Ferreira - Integrante / Vagner Laerte Ardeo - Integrante.
Membro: Eduardo Fonseca Mendes.
4.   2017-Atual. Governança Corporativa de Dados - FGV
Descrição: Este projeto tem como objetivo elaborar diretrizes para a gestão tecnológica, política e científica dos acervos de dados da Fundação Getulio Vargas. Neste contexto institucional, as diversas escolas (Matemática, Direito, Administração, Ciências Sociais, Economia) e o Instituto Brasileiro de Economia buscam as melhores práticas para a criação, gestão e compartilhamento dos grandes acervos de dados públicos, de natureza econômica, política, geográfica, de saúde pública, de mobilidade urbana, dentre outras.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Renato Rocha Souza - Integrante / Moacyr Alvim Horta Barbosa da Silva - Integrante / Flavio Codeco Coelho - Integrante / Pablo Camargo Cerdeira - Coordenador / Eduardo Fonseca Mendes - Integrante / Rodrigo dos Santos Targino - Integrante / Yuri Fahham Saporito - Integrante.
Membro: Renato Rocha Souza.
Descrição: Descrição: Este projeto tem como objetivo elaborar diretrizes para a gestão tecnológica, política e científica dos acervos de dados da Fundação Getulio Vargas. Neste contexto institucional, as diversas escolas (Matemática, Direito, Administração, Ciências Sociais, Economia) e o Instituto Brasileiro de Economia buscam as melhores práticas para a criação, gestão e compartilhamento dos grandes acervos de dados públicos, de natureza econômica, política, geográfica, de saúde pública, de mobilidade urbana, dentre outras... Situação: Em andamento; Natureza: Pesquisa. Integrantes: Eduardo Fonseca Mendes - Coordenador / Renato Rocha Souza - Integrante / Moacyr Alvim Horta Barbosa da Silva - Integrante / Pablo Cerdeira - Integrante / Flavio Codeco Coelho - Integrante / Rodrigo dos Santos Targino - Integrante / Yuri Fahham Saporito - Integrante.
Membro: Eduardo Fonseca Mendes.
5.   2017-Atual. Inferência Bayesiana usando filtros de partículas
Descrição: O interesse na área de simulação Bayesiana usando filtos de partículas vêm crescendo devido ao crescimento do acesso a dados e aumento do poder computacional, principalmente computação paralela. A principal aplicação desses métodos se encontra em inferência Bayesiana paramétrica em modelos com variáveis latentes estruturados, i.e., inferência em modelos gerais em espaço de estado. Nosso foco específico se encontra no desenvolvimento e extensão de técnicas baseadas em amostragem por importância e filtros de partículas para inferência Bayesiana, tanto em (1) modelos em espaço de estado, onde existe a necessidade de construir uma posteriori através de simulação, quanto em (2) modelos gerais, que apresentam estruturas adequadas para amostragem Gibbs e em (3) modelos estáticos, quando algoritmos inferenciais do tipo Sequential Monte Carlo samplers são convenientes. Nós consideramos aplicações em séries temporais multidimensionais, modelos de rede, equações diferenciais estocásticas e estimação de eventos raros. Estas técnicas são utilizadas na modelagem financeira e epidemiológica, tais como modelos de volatilidade estocástica e cálculo de medidas de risco, e modelos SIR. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Eduardo Fonseca Mendes - Coordenador / Rodrigo dos Santos Targino - Integrante. Número de produções C, T A: 2
Membro: Eduardo Fonseca Mendes.
6.   2017-Atual. Modelagem do comportamento de séries espaço-temporais com aplicações ao transporte viário do Município do Rio de Janeiro
Descrição: Utilizando como base os dados de localização dos ônibus do município do Rio de Janeiro, a cada minuto, desejamos responder perguntas pertinentes à dinâmica do trânsito carioca. Buscamos identificar padrões na complexa malha viária do município, a fim de entender como mudanças nas regras dos ônibus e inauguração da Linha 4 do Metrô afetaram o trânsito na cidade; como a velocidade média é afetada com eventos locais e variáveis externas, tais como chuva; dentre outras questões presentes no dia a dia da população. O projeto agrega um número de desafios, tais como o desenvolvimento de robôs para fazer a coleta e processamento dos dados crus e construção da base anaĺítica. Os aspectos metodológicos do projeto agregam a utilização de modelos estatísticos espaço-temporais e de técnicas de aprendizagem de máquinas. Ao fim do estudo, pretendemos entender melhor a dinâmica do trânsito e do transporte público carioca e possuir uma base onde pesquisadores possam trabalhar sem as dificuldades iniciais de acesso aos dados.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (3) . Integrantes: Renato Rocha Souza - Integrante / Moacyr Alvim Horta Barbosa da Silva - Integrante / Eduardo Fonseca Mendes - Integrante / Eduardo Soares Ogasawara - Coordenador.
Membro: Renato Rocha Souza.
Descrição: Utilizando como base os dados de localização dos ônibus do município do Rio de Janeiro, a cada minuto, desejamos responder perguntas pertinentes à dinâmica do trânsito carioca. Buscamos identificar padrões na complexa malha viária do município, a fim de entender como mudanças nas regras dos ônibus e inauguração da Linha 4 do Metrô afetaram o trânsito na cidade; como a velocidade média é afetada com eventos locais e variáveis externas, tais como chuva; dentre outras questões presentes no dia a dia da população. O projeto agrega um número de desafios, tais como o desenvolvimento de robôs para fazer a coleta e processamento dos dados crus e construção da base anaĺítica. Os aspectos metodológicos do projeto agregam a utilização de modelos estatísticos espaço-temporais e de técnicas de aprendizagem de máquinas. Ao fim do estudo, pretendemos entender melhor a dinâmica do trânsito e do transporte público carioca e possuir uma base onde pesquisadores possam trabalhar sem as dificuldades iniciais de acesso aos dados.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Moacyr Alvim Horta Barbosa da Silva - Coordenador / Eduardo Soares Ogasawara - Integrante / Eduardo Fonseca Mendes - Integrante / Renato Rocha Souza - Integrante.
Membro: Moacyr Alvim Horta Barbosa da Silva.
Descrição: Descrição: Utilizando como base os dados de localização dos ônibus do município do Rio de Janeiro, a cada minuto, desejamos responder perguntas pertinentes à dinâmica do trânsito carioca. Buscamos identificar padrões na complexa malha viária do município, a fim de entender como mudanças nas regras dos ônibus e inauguração da Linha 4 do Metrô afetaram o trânsito na cidade; como a velocidade média é afetada com eventos locais e variáveis externas, tais como chuva; dentre outras questões presentes no dia a dia da população. O projeto agrega um número de desafios, tais como o desenvolvimento de robôs para fazer a coleta e processamento dos dados crus e construção da base anaĺítica. Os aspectos metodológicos do projeto agregam a utilização de modelos estatísticos espaço-temporais e de técnicas de aprendizagem de máquinas. Ao fim do estudo, pretendemos entender melhor a dinâmica do trânsito e do transporte público carioca e possuir uma base onde pesquisadores possam trabalhar sem as dificuldades iniciais de acesso aos dados.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) Doutorado: (1) . Integrantes: Eduardo Soares Ogasawara - Coordenador / Eduardo Fonseca Mendes - Integrante / Renato Rocha Souza - Integrante / Moacyr Alvim - Integrante.
Membro: Eduardo Soares Ogasawara.
Descrição: Descrição: Utilizando como base os dados de localização dos ônibus do município do Rio de Janeiro, a cada minuto, desejamos responder perguntas pertinentes à dinâmica do trânsito carioca. Buscamos identificar padrões na complexa malha viária do município, a fim de entender como mudanças nas regras dos ônibus e inauguração da Linha 4 do Metrô afetaram o trânsito na cidade; como a velocidade média é afetada com eventos locais e variáveis externas, tais como chuva; dentre outras questões presentes no dia a dia da população. O projeto agrega um número de desafios, tais como o desenvolvimento de robôs para fazer a coleta e processamento dos dados crus e construção da base anaĺítica. Os aspectos metodológicos do projeto agregam a utilização de modelos estatísticos espaço-temporais e de técnicas de aprendizagem de máquinas. Ao fim do estudo, pretendemos entender melhor a dinâmica do trânsito e do transporte público carioca e possuir uma base onde pesquisadores possam trabalhar sem as dificuldades iniciais de acesso aos dados.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Eduardo Fonseca Mendes - Coordenador / Eduardo Soares Ogasawara - Integrante / Renato Rocha Souza - Integrante / Moacyr Alvim Horta Barbosa da Silva - Integrante.
Membro: Eduardo Fonseca Mendes.
7.   2017-Atual. Plataforma de Ciência de Dados aplicada às Políticas Públicas
Descrição: A Plataforma de Ciência de Dados aplicada às Políticas Públicas será um serviço (Platform as a Service - PaaS) para armazenamento, gestão e análise de Big Data para pesquisadores, docentes e discentes de instituições de ensino e pesquisa na área de políticas públicas, bem como, gestores governamentais.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Doutorado: (1) . Integrantes: Marcel de Moraes Pedroso - Integrante / Igor da Silva Morais - Integrante / Jefferson da Costa Lima - Integrante / Paulo Carlos Du Pin Calmon - Coordenador / Marcelo Estrela Fiche - Integrante. Número de produções C, T A: 3
Membro: Marcel de Moraes Pedroso.

2016

1.   2016-Atual. Análise de padrões do Instituto de Educação Executiva - FGV \ IDE
Descrição: Análise dos padrões socioeconômicos, geográficos, demográficos e escolares dos alunos dos cursos de MBA da Fundação Getulio Vargas, com vistas à caracterização do público, melhoria de oferta de produtos, otimização de cursos e disciplinas e criação de sistemas de recomendação. Através de técnicas de Machine Learning e de Processamento de Linguagem Natural são exploradas as informações do SIGA - Sistema Integrado de Gestão Acadêmica e gerados insights para alimentar os coordenadores educacionais do IDE/FGV. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (1) . Integrantes: Renato Rocha Souza - Coordenador / Eduardo Fonseca Mendes - Integrante.
Membro: Renato Rocha Souza.
2.   2016-Atual. Autoria e Exibição de Documentos Multimídia Interativos
Descrição: Documentos multimídia estão presentes em nosso dia a dia, desde páginas web, programas de TV digital, aplicações de smatphones e etc. Um documento multimídia descreve itens de mídia e relacionamentos entre eles, seja no tempo, espaço ou ambos. Recentes evoluções na apresentação de um documento multimídia, permitem sua adaptação ao contexto do espectador, divisão em múltiplos dispositivos, edição dinâmica, exibição num contexto de realidade aumentada e novas formas de interação pelo espectador, através de gestos e fala. Este projeto tem dois objetivos principais: (i) propor um ferramental de apoio a autoria de documentos multimídia, facilitando sua criação e disseminação por parte do autor; (ii) propor novas formas de interface entre o espectador e um documento multimídia. No sentido documento-espectador, o objetivo é propor novas formas de exibição de um documento, como em um ambiente imersivo. No sentido espectador-documento, o objetivo é explorar novas formas de interação com um documento.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) . Integrantes: Joel André Ferreira dos Santos - Coordenador / AMORIM, GLAUCO FIOROTT - Integrante. Número de orientações: 1
Membro: Joel André Ferreira dos Santos.
3.   2016-2016. Avaliação da Oferta de Serviços de Saúde Suplementar no Estado do Rio de Janeiro
Descrição: Nesse projeto de pesquisa, investigaremos como fatores estruturais da oferta e demanda de prestadores de serviços de saúde no estado do Rio de Janeiro influenciam nos custos e nos preços dos planos de saúde comercializados. Os esforços se concentrarão nos seguintes pontos: (i) identificação dos mercados relevantes da oferta de serviço de saúde pelas operadoras/seguradoras de planos de saúde; (ii) avaliação dos custos de saúde, considerando alguns perfis de beneficiários/segurado nos mercados identificados; e (iii) avaliação do processo de formação do preço (contraprestações pecuniárias ou prêmios de seguros). Para alcançar tais objetivos, teremos acesso a grande banco de dados, o que demandará processos comuns à Big Data na manipulação e modelagem estatística e atuarial destes dados. Existem diversos modelos para avaliar os itens propostos. Modelos lineares serão usados para inferir a relação entre oferta/demanda de serviços com variáveis e fatores de interesse, como, por exemplo, características do beneficiário (idade, sexo, etc.), características da região (econômicas e de desenvolvimento social), operadora, características do plano, etc. Outra classe de modelos que serão aplicados são aqueles pertencentes ao campo da estatística espacial, onde serão consideradas variáveis referentes à distância do beneficiário ao local da prestação do serviço e à oferta próximo de seu local e nas vizinhanças. Além dos objetivos apontados, podemos afirmar que os resultados do trabalho poderão ser de valor em uma otimização no uso de recursos públicos ou de serviço público, como, por exemplo, uso de transporte ou mobilidade. O fluxo de pessoas à procura de serviços de saúde entre regiões do estado incorre em custos, tanto individuais quanto coletivos, e uma racionalização nesta área gera evidentes benefícios. Aqui destacamos a eminente aplicação de pesquisa acadêmica no auxílio à resolução de problemas de interesse público. Outro objetivo e meta do trabalho será o uso dos equipamentos adquiridos com o auxílio e o uso da base de dados na orientação de alunos tanto de pós-graduação, em cursos da Faculdade de Administração e Finanças, quanto no Instituto de Matemática e Estatística, ambos da UERJ. Artigos, monografias e dissertações serão desenvolvidas nos campos de Probabilidade e Estatística Aplicada, Atuária, Sistemas de Informação e, eventualmente, em Economia, caracterizando a multidisciplinariedade do projeto.. Situação: Desativado; Natureza: Pesquisa. Integrantes: Jorge de Abreu Soares - Integrante / Eduardo Fraga Lima de Melo - Coordenador / William Moreira Lima Neto - Integrante / César da Rocha Neves - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
Membro: Jorge de Abreu Soares.
4.   2016-Atual. Ciência de Dados em Séries Espaço-Temporais: Gerência de Dados Applications
Descrição: Processo: 302993/2015-0, Programa: PQ 2015, Valor financiado: R$39.600,00. Ciência de Dados é uma disciplina de extração de conhecimento a partir dos dados. Um subconjunto de aplicações relevantes de Ciência de Dados engloba o estudo de séries temporais e espaço-temporais. As séries temporais correspondem a uma sequencia de observações, enquanto as séries espaço-temporais apresentam uma posição associada a essa sequência. Essas observações podem ser univariadas, multivariadas e ter domínios diferentes, trazendo um caráter heterogêneo aos dados. As aplicações em séries espaço-temporais comumente recaem na exploração de métodos de representação, indexação, predição, classificação e padrões frequentes. Para cada método, existem inúmeros algoritmos associados. A solução de um determinado problema pode envolver a combinação de diferentes métodos e algoritmos. Nesse contexto, a gerência dos dados passa a ser um ponto chave no processo de extração de conhecimento. Desta forma, este trabalho de pesquisa visa contribuir para o aumento da eficiência e eficácia das abordagens na gerência de dados de séries espaço-temporais em diferentes aplicações. Para tanto, pretende-se atuar em três frentes: (i) Armazenamento e Paralelismo de Dados, (ii) Métodos de Preprocessamento, (iii) Aplicações em Problemas de Predição, Classificação e Padrões Frequentes. A pesquisa combina o estudo aplicado de séries temporais e espaço-temporais em problemas de predição, classificação e padrões frequentes com as pesquisas básicas em gerência de dados (armazenamento, paralelismo e métodos de preprocessamento) visando entender a fundo em quais circunstâncias a gerência de dados em séries espaço-temporais precisa ser refinada. A partir dessa análise, será possível investir com propriedade na resolução de problemas reais propostos para cenários de predição, classificação e padrões frequentes em séries espaço-temporais.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (4) . Integrantes: Eduardo Soares Ogasawara - Coordenador. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Bolsa.
Membro: Eduardo Soares Ogasawara.
5.   2016-Atual. Gerência e Analise de Grandes Volumes de Dados Científicos
Descrição: Este projeto estrutura as atividades de pesquisa, ensino e inovação sendo desenvolvidas no laboratório Data Extreme Lab (DEXL), membro do Laboratório Nacional de Computação Científica (LNCC), instituto do Ministério da Ciência, Tecnologia e Inovação (MCTI), e coordenado pelo proponente desta proposta. Em consonância com o Plano Diretor da Unidade (2011-2015), o DEXL, fundado em 2010, se propõe a desenvolver atividades de pesquisa e inovação na área de gerência e análise de grandes volumes de dados científicos, em cooperação com instituições nacionais e internacionais. Neste sentido, foram estabelecidas cooperações científicas em áreas tais como: astronomia (laboratório LIneA ? Observatório Nacional); Ciência do Esporte, Laboratório Olímpico (Comitê Olímpico Brasileiro), Biologia, Projeto Ecológico de Longa Duração ? Guanabara, e Medicina Apoiada por Ciência da Computação, INCT-MACC, além de petróleo e gás, em parceria com a empresa EMC Research Brazil. Além de oferecer apoio tecnológico a estes projetos, importantes linhas de pesquisa foram sendo desvendadas e exploradas em trabalhos de Doutorado, Mestrado e Iniciação Científica, produzindo resultados em publicações, patentes e formação de recursos humanos. Ainda mostrando aderência aos objetivos da instituição, contribuímos como coordenadores e participantes de projetos de cooperação internacional com grupos de pesquisa na França. Pretendemos nessa colaboração, preparamo-nos para explorar o novo super-computador peta-flópico recém instalado no LNCC. Apesar de ainda constar como superficial em nossos trabalhos, alguns de nossos resultados [Costa et al. 2012, Lustosa et al. 2015] pretendemos que sejam estendidos para este novo desafio. Neste sentido, o objetivo deste projeto é de solidificar os avanços alcançados nestes últimos três anos e colocando o laboratório DEXL como importante fonte de pesquisa e inovação em nossa área. A proposta se enquadra na gerência e análise de grandes volumes de dados em apoio à nova Ciência de Dados.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Doutorado: (5) . Integrantes: Fabio Andre Machado Porto - Coordenador / Rocio Zorrilla - Integrante / Douglas Ericson Marcelino de Oliveira - Integrante / Patrick Valduriez - Integrante / Eduardo Ogasawara - Integrante / FREIRE, VINICIUS PIRES DE MOURA - Integrante / Amir Khatibi Mogadan - Integrante / Yania Molina Souto - Integrante / Noel Lemus - Integrante / João Guilherme Rittmeyer Nobre - Integrante / Rodrigo Botelho - Integrante. Financiador(es): (CNPq) Conselho Nacional de Desenvolvimento Científico e Tecnológico - Bolsa.
Membro: Fabio Andre Machado Porto.
6.   2016-Atual. Identificação de Motifs em Séries Espaço-Temporais: Aplicações Métodos
Descrição: Processo: E-26/210.525/2016 Programa: APQ1 2015/02 Valor financiado: R$10.000,00 A extração de conhecimento a partir dos dados é uma atividade extremamente importante e demandada por diversas organizações existentes no eixo empresarial, governamental e científico. A Ciência de Dados é uma área interdisciplinar que aborda a resolução de tal atividade considerando grandes volumes de dados em suas variações de formatos (estruturados e não-estruturados). Um subconjunto de problemas importantes abordados em Ciência de Dados engloba o estudo de séries temporais e espaço-temporais. As séries temporais correspondem a uma sequência de observações, enquanto as séries espaço-temporais apresentam uma posição associada a essa sequência. Essas observações podem ser univariadas, multivariadas e terem diferentes domínios e periodicidade, trazendo um caráter heterogêneo aos dados. As pesquisas em séries temporais comumente recaem na exploração de métodos de representação, indexação e identificação de \emph{motifs} sobre os dados. Um \emph{motif} é definido como uma subsequência, previamente desconhecida, que frequentemente se repete, sem sobreposição, ao longo de uma série temporal. Já no contexto das séries espaço-temporais, apesar de não ser difícil elencar um conjunto de aplicações que demanda esse tipo de análise, o estudo de \emph{motifs} encontra-se pouco explorado. Sendo assim, este projeto explora essa lacuna, combinando pesquisa básica e aplicada no contexto de identificação de \emph{motifs} em séries espaço-temporais. A pesquisa, portanto, é dividida no estudo de novos métodos identificação de \emph{motifs} em séries espaço-temporais e a aplicação em diferentes problemas existentes nas áreas de aviação, mobilidade urbana, astronomia e sísmica.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (7) / Mestrado acadêmico: (4) / Doutorado: (1) . Integrantes: Eduardo Soares Ogasawara - Coordenador / Fábio Porto - Integrante / Gustavo Paiva Guedes e Silva - Integrante / Kele Belloze - Integrante / Esther Pacitti - Integrante / Florent Masseglia - Integrante / Jorge de Abreu Soares - Integrante / Laura Silva de Assis - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
Membro: Eduardo Soares Ogasawara.
7.   2016-Atual. Projeto REI: Comunicação em Redes Elétricas Inteligentes
Descrição: Processo: E-26/010.001638/2016. Programa: Apoio a Grupos Emergentes 2016. Valor Financiado: R$175.972,00 Uma rede elétrica inteligente (smart grid) traz propostas inovadoras que mudam a forma como a energia é provida desde a geração até os consumidores finais. Dentre as novas propostas para smart grids, destacam-se a geração de energia de forma distribuída, o amplo uso de fontes renováveis, o uso de carros elétricos, um intenso monitoramento da rede elétrica e o uso de medidores inteligentes. Um importante desafio no desenvolvimento de smart grids é a criação de uma infraestrutura de comunicação que permita a troca de informações entre todos os componentes da rede elétrica. Este projeto tem por objetivo principal projetar e desenvolver soluções para comunicação em redes elétricas inteligentes, considerando a geração distribuída e a troca de dados bidirecional entre a concessionária e os clientes.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Joel André Ferreira dos Santos - Integrante / Diego Gimenez Passos - Integrante / Ricardo Campanha Carrano - Integrante / Natália Castro Fernandes - Integrante / Igor Monteiro Moraes - Coordenador. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
Membro: Joel André Ferreira dos Santos.
8.   2016-Atual. SiADE2 - Sistemas de Apoio ao Diagnóstico e Tratamento de Doenças do Envelhecimento
Descrição: O envelhecimento populacional é um processo global observado primeiramente nos países desenvolvidos e que, durante as últimas décadas, tem ocorrido também nos países em desenvolvimento. O aumento das doenças neurodegenerativas, como as demências, está relacionado com tal envelhecimento. A Doença de Alzheimer é considerada uma forma de demência mais séria. O avanço na proporção de número de casos de pacientes com Doença de Alzheimer é motivo de preocupação para os governos e instituições públicas, o que torna evidente a relevância de pesquisas que ajudem no diagnóstico desta doença em um estágio pré-clínico, onde as principais funções cognitivas do paciente ainda estão preservadas, melhorando a eficiência do tratamento e estendendo a qualidade de vida do paciente. O Projeto SIADE - Pesquisas em Sistemas de Apoio à Decisão e ao Diagnóstico de Doenças Associadas ao Envelhecimento (http://siade.midiacom.uff.br), apoiado pela FAPERJ de 2013 a maio de 2016, iniciou pesquisas em sistemas de apoio a decisão para demência, doença de Alzheimer e transtorno cognitivo leve. O presente projeto SIADE2 é uma proposta de continuação dessas pesquisas, visando refinar o sistema proposto e estendê-lo para outras doenças. Outro foco deste projeto é em pesquisas sobre autoria de sistemas mulsemídia, com o objetivo de aplicá-los a exercícios cognitivos a idosos, visando a prevenção e o tratamento de doenças neurodegenerativas. Os principais resultados esperados são um sistema de apoio ao diagnóstico para doenças neurodegenerativas, um novo modelo conceitual mulsemídia que contemple múltiplos efeitos sensoriais, novos exercícios cognitivos para idosos, orientação de alunos de pós-graduação e graduação na UFF, CEFET/RJ e IPRJ/UERJ, e publicação de artigos em periódicos e conferências científicas.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Joel André Ferreira dos Santos - Integrante / Débora Christina Muchaluat Saade - Coordenador / Flávio Luiz Seixas - Integrante / Aura Conci - Integrante / Lincon F. Silva - Integrante / Anderson Amendoeira Namen - Integrante / Sílvia Mara da Costa Campos Victer - Integrante.
Membro: Joel André Ferreira dos Santos.
9.   2016-Atual. UFFeScience: Apoio Computacional a Experimentos de Larga Escala para Desenho de Novas Drogas para Tratamento de Doenças Tropicais Negligenciadas (FAPERJ, Edital Apoio a Grupos Emergentes de Pesquisa no Estado do Rio de Janeiro)
Descrição: O termo "Doenças Tropicais Negligenciadas" se refere a um grupo de doenças tropicais endêmicas que afetam em especial habitantes da Ásia, África e da América Latina. Algumas dessas DTN são responsáveis por altas taxas de mortalidade nessas regiões. Assim, para a população desses países, a descoberta de novas drogas que possam ser usadas como tratamento para as DTN é uma prioridade. Em especial no cenário brasileiro, e mais especificamente no estado do Rio de Janeiro, diversas DTN atingem parte da população, como por exemplo, a Dengue. Embora o Brasil tenha avançado significativamente na última década em vários campos da ciência, as pesquisas em áreas multidisciplinares como a bioinformática ainda estão em amadurecimento, e estas desempenham um papel fundamental para o desenvolvimento do país e do estado e para a descoberta de novas drogas para o tratamento das DTN. Diversas pesquisas de sucesso no ramo da bioinformática têm proposto protocolos in-silica (baseado em simulações computacionais) que utilizam análises filogenéticas/filogenônicas e mais recentemente as análises farmacofilogenônicas. Esses protocolos normalmente envolvem um conjunto de programas que executam simulações científicas e que são encadeados formando um fluxo coerente de atividades, ao qual denominamos workflow. Em um mesmo experimento de bioinformática para descoberta de novas drogas para DTN é comum que tenhamos mais de um workflow e que este mesmo workflow seja executado diversas vezes, variando-se dados de entrada e parametrização de configuração, a fim de confirmar ou refutar uma determinada hipótese. Entretanto, gerenciar um experimento nesse contexto não é uma tarefa trivial. Cada execução de um workflow pode consumir e produzir um grande volume de dados, o que comumente requer Processamento de Alto Desempenho (PAD) aliada a técnicas de paralelismo para produzir resultados em tempo hábil. A demanda por técnicas de gerência de experimentos em ambientes de PAD vem crescendo a cada ano, ao mesmo tempo em que surgem novos ambientes como as nuvens de computadores (que podem ser multi-site e federadas) e as unidades de processamento gráfico de propósito geral (GPGPUs). Um dos maiores desafios na gerência de experimentos científicos nesses ambientes reside na distribuição das execuções das atividades dos workflows nos recursos de forma eficiente. Essas execuções podem ser distribuídas em mais de um ambiente (cluster local, nuvem e GPGPU) e essa heterogeneidade insere uma complexidade adicional (e grande) no processo. Além disso, devemos nos preocupar com a gerência de metadados e com a análise dos resultados obtidos. Diversas pesquisas na área de mineração de dados e aprendizado de máquina têm sido propostas com foco na análise de grandes volumes de dados. Entretanto, os dados biológicos produzidos por esses experimentos não podem ser representados como tuplas chave-valor, como acontece tradicionalmente em algoritmos de mineração de dados (e.g. K-means). Dados biológicos são normalmente multi-relacionados, o que demanda técnicas de aprendizado de máquina mais complexas como a mineração de dados multi-relacional (MDMR). Uma vez que essas técnicas possam ser aplicadas/adaptadas no contexto de experimentos de bioinformática para descoberta de novas drogas podemos descobrir novos padrões de sequências, funções de genes e interações proteína-proteína que alavanquem investigações na terapia de DTN. O objetivo principal deste projeto de pesquisa está no desenvolvimento de novas técnicas de gerência de experimentos para DTN.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (6) / Doutorado: (2) . Integrantes: Vanessa Braganholo Murta - Integrante / Daniel Cardoso Moraes de Oliveira - Coordenador / Aline Marins Paes - Integrante / Isabel Rosseti - Integrante / Yuri Frota - Integrante / Cristina Nader Vasconcelos - Integrante / Christiano de Oliveira Braga - Integrante / Bruno Lopes Vieira - Integrante.
Membro: Vanessa Braganholo Murta.
10.   2016-Atual. Validação Dinâmica de Documentos Multimídia Interativos
Descrição: Processo: E-26/010.002327/2016. Programa: APQ1 2016. Valor Financiado: R$11.000,00 Programa: APQ1 2016. Documentos multimídia são comumente definidos como uma descrição de um conjunto de itens de mídia e relações entre eles no tempo, espaço ou ambos. Ao ser executado, um documento produz um arranjo de itens de mídia no tempo e espaço chamado de uma apresentação multimídia. Avanços na apresentação de um documento multimídia permitem, dentre outras facilidades, sua adaptação ao contexto do espectador, sua divisão em múltiplos dispositivos e sua edição dinâmica. Desde sua criação até sua execução, portanto, um documento passa por diferentes etapas. Tais etapas representam o ciclo de vida de um documento multimídia. A especificação contida em um documento pode mudar de etapa a etapa, pois um documento é especificado, instanciado, adaptado e pode ter seu conteúdo e estrutura editada dinamicamente. É importante, portanto, garantir a consistência de um documento multimídia ao longo do seu ciclo de vida. Isto significa que o documento sempre seguirá um conjunto de diretrizes expressas em tempo de autoria. Este projeto tem como objetivo o estudo e proposta de uma ferramenta para a validação de um documento multimídia ao longo de sua execução, mantendo assim sua consistência ao longo de sucessivas edições dinâmicas.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Joel André Ferreira dos Santos - Coordenador. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
Membro: Joel André Ferreira dos Santos.

2015

1.   2015-Atual. Archives Without Borders Exploratory Research on Accelerating Declassification and Creating an International, Web-Based Archive
Descrição: This proposal calls for building a community of researchers in different countries who are ready to work together to tackle the problems and seize the opportunities presented by aggregating electronic archives. This project would begin by bringing together teams of archivists, social scientists, and data scientists from the U.S., the U.K., and Brazil to conduct exploratory research, develop ?proof of concept? prototypes, and engage the broadest possible audience in outreach with partners in the media and government.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Renato Rocha Souza - Coordenador / Flavio Codeco Coelho - Integrante / Suemi Higuchi - Integrante / Celso Castro - Integrante / Matthew Connelly - Integrante.
Membro: Renato Rocha Souza.
2.   2015-Atual. Integração de dados e técnicas de bioinformática para priorização de alvos para fármacos
Descrição: A priorização de alvos é um dos passos principais no processo de descoberta de novos fármacos. Um bom alvo precisa ser eficaz, atender às necessidades clínicas e comerciais e ser "drogável". Existem diversas bases de dados públicas que nos ajudam a levantar estas informações, pois armazenam grandes quantidades de dados muito úteis para serem explorados e analisados, como dados genômicos, proteômicos, bioquímicos e farmacológicos. Muitos estudos experimentais podem ser realizados baseando-se na exploração dos dados contidos nestas bases ou combinando dados de múltiplas fontes. Integração de dados aliada a técnicas de bioinformática são algumas abordagens utilizadas na priorização de alvos. Este projeto tem como objetivo explorar e analisar estas bases de modo a selecionar alvos para fármacos no combate a doenças específicas, as quais são classificadas como negligenciadas.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) . Integrantes: Kele Teixeira Belloze - Coordenador.
Membro: Kele Teixeira Belloze.
3.   2015-Atual. Modelagem Computacional da Pseudomonas aeruginosa CCBH 4851
Descrição: As infecções relacionadas ao serviço de saúde constituem grave problema de saúde pública. Podem ser associadas com a morbidade e mortalidade e são responsáveis pelo aumento no tempo de hospitalização do doente. A P. aeruginosa é um patógeno versátil associado com um amplo espectro de infecções em seres humanos. O controle da infecção é difícil, pois a P. aeruginosa é inerentemente resistente a muitos antibióticos. Além disso, o tratamento está sendo comprometido, cada vez mais, devido ao surgimento e disseminação dessa resistência. Assim, temos poucos agentes como opções terapêuticas. Neste contexto, é importante identificar estratégias que possam impedir a disseminação desta bactéria em pacientes hospitalizados. Está claro que estudos adicionais são necessários para descobrir novos mecanismos de virulência bacteriana e alvos terapêuticos contra este patógeno altamente resistente a antibióticos e com ocorrência de cepas resistentes a todas as opções de tratamento. O objetivo principal deste projeto é criar um modelo computacional de célula inteira da Pseudomonas aeruginosa CCBH4851, que é uma cepa encontrada em hospitais públicos brasileiros cujos dados são fornecidos pelo LAPIH/IOC/IOCRUZ, a fim de que possamos prever os fenômenos complexos de células inteiras em termos de moléculas individuais e suas interações. Alguns objetivos específicos são: 1. Descrever o ciclo de vida de uma única célula a partir do nível de moléculas individuais e as suas interações; 2. Prever com precisão uma ampla gama de comportamentos celulares observáveis, inclusive aqueles relacionados com multiresistência e suscetibilidade a novos fármacos; Site do projeto: http://pseudomonas.procc.fiocruz.br.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) . Integrantes: Kele Teixeira Belloze - Coordenador / Floriano P Silva-Jr - Integrante / Fabricio Alves Barbosa da Silva - Integrante / Ernesto Prado Lopes - Integrante / Maria Clicia Stelling de Castro - Integrante / Ana Paula D'Alincourt Carvalho Assef - Integrante / Nicolas Carels - Integrante / Daniel Antunes Maciel Villela - Integrante / Márcio Argollo Ferreira de Menezes - Integrante / Rodolpho Mattos Albano - Integrante / Marcelo Trindade dos Santos - Integrante.
Membro: Kele Teixeira Belloze.
4.   2015-Atual. Modelagem de dados Clínicos para troca de informação entre os sistemas de registro eletrônico em saúde utilizados pela UFMGe a base de RES-MG Transferência de informações entre diferentes níveis de cuidados da rede de atenção à saúde do SUS
Descrição: Descrição: Financiamento FAPEMIG aprovado em 7/abril/2015 APQ-03486-13 No presente estudo, utilizaremos o cenário do cuidado obstétrico como caso de uso (use case) para estudo e desenvolvimento de soluções de conectividade entre sistemas. Partindo da assistência pré-­‐natal em unidades básicas de saúde até a admissão para o parto, seguida da alta materna e neonatal, esta modalidade assistencial permite a troca, de forma ágil pela duração bem definida do cuidado à gestante, entre os elementos em um cenário de saúde real para contextualizar o emprego de instrumentos metodológicos destinados à comunicação entre sistemas de informação. O Ministério da Saúde brasileiro regulamentou um conjunto de recomendações e procedimentos para se atingir padrões compatíveis com essa comunicação entre SIS, através da Portaria Nº 2.073 (2011), entretanto ainda longe de estarem implementados, tais requisitos demandarão transferência de tecnologia de desenvolvedores de procedimentos e softwares com este propósito, além de ações multidisciplinares entre a medicina e a informática, objetos específicos deste projeto de pesquisa. Considerando-­‐se a necessidade de aquisição de know-­‐how específico e de desenvolvimento de capacidades técnicas na construção e manutenção de SIS, além da infraestrutura do Estado de Minas Gerais disponibilizada para o armazenamento e gestão de informações clínicas de forma segura e as potencialidades dos parceiros envolvidos nesta proposta. Este estudo científico de caráter interdisciplinar entre a medicina, ciência da informação e da computação compreende o desenvolvimento e aplicação de um modelo para gestão da informação em saúde ao buscar de forma segura, oportuna e eficaz proporcionar o acesso de profissionais de saúde às informações clínicas em sistemas eletrônicos de informação distintos, visando à continuidade do cuidado.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (1) . Integrantes: Renato Rocha Souza - Integrante / Maurício Barcellos Almeida - Integrante / Zilma Silveira Nogueira Reis - Coordenador / Thabata Queiroz Vivas de Sá - Integrante.
Membro: Renato Rocha Souza.
5.   2015-Atual. Processamento paralelo baseado em dados
Descrição: Edital de Grupo de Pesquisa do CEFET/RJ 2016 e 2017: Valores financiados: R$6.992,00 e R$142.337,40. No que se refere ao processo de ciência dos dados, existe uma necessidade urgente de usar o processamento de alto desempenho (HPC) para obter uma análise de dados em grande escala. Há importantes desafios ao estabelecer essas análises, comumente modeladas como fluxos de trabalho. Nesses fluxos de trabalho, atividades e dados são direcionados para a execução em algum ambiente HPC (por exemplo, clusters, grades, nuvens). Devido à diversidade das plataformas existentes para ambientes HPC, um dos grandes desafios é estabelecer uma representação desses fluxos de trabalho agnósticos para o meio ambiente em que serão executados e, pelo menos, otimizar sua execução no ambiente alvo. Existem inúmeros desafios no gerenciamento e análise de grandes volumes de dados. As diferentes aplicações, ao se apresentarem como pesquisas aplicadas, muitas vezes oferecem a oportunidade de elaborar novos quadros teóricos na pesquisa básica de paralelismo baseado em dados. Em particular, as características espaciais e temporais da série spatiotemporal trazem vários aspectos importantes e, ao mesmo tempo, específicos que requerem algoritmos diferenciados para gerenciar esses dados. No contexto das séries espaço-temporais, explore as mais recentes soluções tecnológicas para potencializar ou permitir as diferentes formas de organização e armazenamento de dados, incluindo abordagens baseadas em sistemas de armazenamento distribuídos (HDFS), bancos de dados objeto-relacionais, NoSQL e NewSQL, e paralelismo baseado em dados usando abordagens baseadas em Map-Reduce, Spark ou álgebra para fluxos de trabalho. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Eduardo Soares Ogasawara - Coordenador / Kele Belloze - Integrante / Jorge de Abreu Soares - Integrante / Rafaelli Coutinho - Integrante.
Membro: Eduardo Soares Ogasawara.
6.   2015-2017. Índice Espacial de Preços ao Consumidor (IEPC-RJ) por regiões da cidade do Rio de Janeiro
Descrição: A partir de parceria firmada em Setembro de 2014, a Escola de Matemática Aplicada (FGV/EMAp) e o Instituto Brasileiro de Economia (FGV/IBRE) criarão um Índice Espacial de Preços ao Consumidor (IEPC-RJ) por regiões da cidade do Rio de Janeiro. Com periodicidade mensal, a princípio, o indicador de inflação será estimado entre os meses de janeiro de 2007 ? período anterior à divulgação do Rio como sede das Olimpíadas ?, e dezembro de 2013. O IBRE irá utilizar a base de dados usada pelo Índice de Preços ao Consumidor (IPC) e pelo Monitor da Inflação. Já a EMAp entrará com o conhecimento técnico em georreferenciamento e computação gráfica para a visualização dos dados.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) . Integrantes: Renato Rocha Souza - Coordenador / Eduardo Fonseca Mendes - Integrante / Pedro Guilherme Costa Ferreira - Integrante / Kizzy Fernanda Terra Ferreira dos Reis - Integrante / Márcio Maciel Bastos - Integrante / Vagner Laerte Ardeo - Integrante. Financiador(es): Fundação Getúlio Vargas - Bolsa.Número de orientações: 1
Membro: Renato Rocha Souza.

2014

1.   2014-Atual. Desafios Computacionais para Mobilidade Urbana (CNPq, Edital Universal)
Descrição: A principal motivação deste projeto encontra-se na dificuldade de locomoção nas grandes cidades. Essa dificuldade de locomoção, em especial no que tange a transporte público (ônibus), se dá por diversas razões, dentre elas: linhas de ônibus mal planejadas, excesso de ônibus em algumas linhas e falta de ônibus em outras linhas, distribuição não uniforme de ônibus nas linhas e falta de visibilidade da carga do sistema viário por parte dos passageiros. Como consequência, os usuários do sistema de ônibus gastam mais tempo do que o necessário para chegar aos seus destinos, se expondo a stress e cansaço, que podem contribuir para queda na produtividade de suas atividades profissionais. Além disso, os usuários ficam expostos a violência, também comum nas grandes cidades, em função de esperas prolongadas e desnecessárias nos pontos de ônibus. O objetivo do projeto consiste em analisar dados referentes a mobilidade urbana das cidades do Rio de Janeiro e Niterói e cruzar esses dados com dados sociais, econômicos e de produtividade. Como resultado, pretendemos fornecer à população e às prefeituras dessas cidades informações úteis sobre a situação atual de mobilidade urbana. Como contribuição concreta, vislumbramos a utilização dessas informações para uma aplicação mais racional do sistema de transporte público no Rio de Janeiro e em Niterói. Vale notar que essas duas cidades somam mais de 6 milhões de habitantes, que podem ser beneficiados por essa pesquisa. Estamos estabelecendo parcerias com as prefeituras e outras instituições que operam linhas de ônibus nessas cidades, tanto para a obtenção dos dados quanto para o fornecimento dos resultados obtidos por esse projeto.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (4) / Mestrado acadêmico: (1) . Integrantes: Vanessa Braganholo Murta - Integrante / Juliana Freire - Integrante / Esteban Clua - Integrante / Leonardo Gresta Paulino Murta - Coordenador / Marcos de Oliveira Lage Ferreira - Integrante / Claudio T. Silva - Integrante. Financiador(es): (CNPq) Conselho Nacional de Desenvolvimento Científico e Tecnológico - Bolsa / (CNPq) Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
Membro: Vanessa Braganholo Murta.
2.   2014-Atual. Ferramentas de apoio a autoria Multimídia
Descrição: O projeto tem como objetivo criar um ferramental que dê suporte e possa facilitar o trabalho do desenvolvedor de aplicações multimídia.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) . Integrantes: Joel André Ferreira dos Santos - Integrante / Glauco Fiorott Amorim - Coordenador.
Membro: Joel André Ferreira dos Santos.
Descrição: Linguagens de autoria para desenvolvimento de aplicações multimídia utilizam o paradigma declarativo cujo objetivo é tentar simplificar a codificação. Entretanto, aplicações multimídia podem mapear desde sincronização temporal entre os objetos de mídia até relacionamentos entre os mesmos. Apesar da facilidade de uso da linguagem, o aumento da quantidade de mídias que podem ser apresentadas leva a uma aumento considerável da complexidade de codificação. Nesse sentido, a criação de ferramentas para dar apoio a autoria de documentos multimídia torna-se fundamental. Portanto, o objetivo do projeto é a criação de um ferramental que dê suporte e possa facilitar o trabalho do desenvolvedor de aplicações multimídia.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) . Integrantes: Glauco Fiorott Amorim - Coordenador / JOEL ANDRÉ FERREIRA DOS SANTOS - Integrante.
Membro: Glauco Fiorott Amorim.
3.   2014-Atual. MUSIC - Gerência de dados científicos em uma nuvem multi-site
Descrição: Grandes projetos científicos em astronomia, biologia, medicina e engenharia produzem grandes volumes de dados, fruto de observação ou coleta instrumentada, ou ainda calculados por simulações numéricas de fenômenos. Na astronomia, por exemplo, projetos como o Large Synoptic Survey Telescope (LSST) estima produzir um mapa 3D do Universo com nível de detalhe e profundidade sem precedentes, o que se traduz em centenas de petabytes de dados em disco. Além do grande volume, dados científicos são imprecisos, devido aos aspectos de calibração dos instrumentos de captura, ou mesmo das incertezas introduzidas nos modelos dos fenômenos observados. Finalmente, grandes projetos científicos são desenvolvidos por grupos de pesquisadores em colaboração, produzindo dados e programas em grande quantidade, distribuídos e heterogêneos. Cientistas adotam workflows científicos como abstrações para as etapas computacionais envolvidas no experimento e a troca de dados entre estes. Além disso, sistemas de gerência de workflows científicos oferecem transparência em relação à complexidade do ambiente computacional, explorando técnicas eficientes de execução, como a execução paralela, e a coleta de dados de proveniência, com suporte à reprodução de experimentos e correções dinâmicas da execução. Finalmente, grandes sistema computacionais integrados, como o SINAPAD coordenado pelo LNCC, são vistos como uma nuvem computacional multi-site que visa a oferecer escalabilidade e acesso a recursos (máquinas, dados e programas) distribuídos, de forma transparente. Desta forma, este projeto pretende desenvolver uma arquitetura em nuvem multi-site para a gerência e análise de grandes volumes de dados científicos. A arquitetura multi-site em nuvem poderá ser utilizada como plataforma compartilhada para experimentos computacionais em diferentes disciplinas da ciência que se valerão de armazenamento, acesso, integração e processamento paralelo de seus dados distribuídos pela arquitetura de forma transparente.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (10) Doutorado: (10) . Integrantes: Fabio Andre Machado Porto - Coordenador / Esther Pacitti - Integrante / Alvaro L.G.A. Coutinho - Integrante / Reza Akbarinia - Integrante / Patrick Valduriez - Integrante / Eduardo Ogasawara - Integrante / DE OLIVEIRA, DANIEL - Integrante / Kary Ocana - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
Membro: Fabio Andre Machado Porto.
4.   2014-2015. Visualização, Análise e Colaboração para Interpretação Sísmica?
Descrição: O presente Programa de Trabalho, intitulado ?Visualização, Análise e Colaboração para Interpretação Sísmica? tem por objetivo a realização conjunta de projeto de Pesquisa e Desenvolvimento (?PD?) que visa especificar e implementar o protótipo de uma plataforma de software para suporte à visualização e à análise colaborativa de grandes volumes de dados sísmicos, a ser aplicada no contexto de interpretação sísmica. Para tal, serão utilizados mecanismos de armazenamento e processamento de dados massivamente paralelos e técnicas avançadas de visualização e consulta remotas de grandes volumes de dados.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (1) Doutorado: (1) . Integrantes: Fabio Andre Machado Porto - Coordenador / Jonas Dias - Integrante / Angelo Ciarlini - Integrante / Amir Khatibi Mogadan - Integrante / Noel Lemus - Integrante. Financiador(es): EMC - Bolsa.Número de orientações: 2
Membro: Fabio Andre Machado Porto.

2013

1.   2013-Atual. Centro de Inovação de Computação em Nuvem
Descrição: O presente projeto tem como objetivo principal estabelecer parcerias entre órgãos do Governo Federal, Empresas Públicas, Sociedades de Economia Mista, Universidades e Entidades de Pesquisa, visando o desenvolvimento e implementação de Projetos Tecnológicos Científicos no segmento de Tecnologia da Informação e Comunicação, mediante a realização conjunta de atividades de pesquisa, absorção e transferência de tecnologias. A partir da definição de diretrizes comuns, estabelecem-se também os objetivos de impulsionar a realização de projetos de inovação e promover o intercâmbio cultural, de profissionais e entidades acadêmicas nas áreas de interesse.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (4) Doutorado: (3) . Integrantes: Fabio Andre Machado Porto - Integrante / Bruno Richard Schulze - Integrante / Antonio Tadeu Azevedo Gomes - Coordenador / Artur Ziviani - Integrante.
Membro: Fabio Andre Machado Porto.
2.   2013-2017. DocX - Processamento de consultas e gerência de versões de documentos XML (CNPq, Edital Universal)
Descrição: O volume de dados XML disponível atualmente vem crescendo cada vez mais. Este fato faz com que a necessidade de mecanismos eficientes de gerência de dados XML seja cada vez maior. Nesse projeto, tratamos de dois problemas diretamente relacionados à gerência de dados XML: processamento de consultas e gerência de versões. Existem vários trabalhos na literatura que lidam com o problema de processar consultas sobre dados XML. Uma abordagem bastante utilizada reside no processamento de consultas em paralelo. Para isso, os dados precisam estar distribuídos em diversos nós de uma rede. Fazer uma fragmentação fixa a priori pode gerar muito desbalanceamento de carga no processamento das consultas. A fragmentação virtual flexibiliza a rigidez da fragmentação física que é fixa. Por ser dinâmica, a fragmentação virtual tem se mostrado um uma boa alternativa para ganho de desempenho no processamento de consultas. No entanto, a abordagem existente, proposta pela proponente e sua equipe, ainda sofre de problemas de balanceamento de carga. Além disso, nem sempre o ambiente disponível dispõe de diversos nós de processamento para executar as consultas. Visando atender também a esse tipo de ambiente, em trabalhos anteriores comparamos o desempenho de processadores de consulta XQuery com máquinas de inferência Prolog. Surpreendentemente, diversas consultas executadas nas máquinas de inferência Prolog obtiveram melhor desempenho do que as consultas equivalentes executadas em processador XQuery nativo. No entanto, este estudo inicial usou traduções ad‐hoc que precisam ser sistematizadas e mais bem estudadas. Que tipo de consulta se beneficia do uso de máquina de inferência em seu processamento? Como traduzir consultas XML para consultas Prolog automaticamente? Outra questão primordial que tem recebido pouca atenção na literatura é a gerência de versões de documentos XML. Para que o controle de versões seja efetivo, são necessárias três operações: diff2 (que calcula a diferença entre duas versões consecutivas), diff3 (que calcula a diferença entre duas versões alternativas derivadas da mesma versão base), e merge (que consolida em um único documento as mudanças realizadas em duas versões alternativas). As técnicas existentes exploram a sintaxe e conteúdo do documento para o cálculo do diff2 [Cobena et al. 2002; Wang et al. 2003; Santos and Hara 2007; Sundaram and Madria 2012]. Técnicas para diff3 e merge têm recebido pouca atenção. Essas são questões que este projeto de pesquisa pretende investigar.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (6) Doutorado: (4) . Integrantes: Vanessa Braganholo Murta - Coordenador / Daniel Cardoso Moraes de Oliveira - Integrante / Aline Marins Paes - Integrante / Luiz Augusto Matos da Silva - Integrante / Leonardo Gresta Paulino Murta - Integrante / Marta Lima de Queirós Mattoso - Integrante. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
Membro: Vanessa Braganholo Murta.
3.   2013-2016. Gerenciamento de Grandes Volumes de Dados Científicos
Descrição: O termo em inglês Big Data refere-se à grandes volumes de dados requerendo novas técnicas para o tratamento de seu armazenamento, processamento e análise [Stonebraker et al. 2009][Becla et al. 2007]. No domínio de aplicações científicas, Big Data se traduz no tratamento dos dados produzidos durante o ciclo de vida da pesquisa, desde a formulação da hipótese científica até sua confirmação ou refutação. No estágio atual da gerência de dados científicos, têm-se focado em uma das etapas deste ciclo, referente a fase do ciclo experimental [Mattoso et al. 2010]. Nesta fase, os cientistas modelam seus experimentos utilizando-se de linguagens de workflows científicos [Zhao et al 2008, Mattoso et al. 2008] e, com muita frequência, mantêm os dados em arquivos do sistema operacional. O processamento desses arquivos é realizado por sistemas de gerência de workflows científicos, tais como Kepler [Ludascher et al. 2006], Swift [Wilde et al. 2011], Chiron [Ogasawara et al. 2011] e QEF [Porto et al. 2007]. A área de astronomia, destaca-se nesse contexto a partir do grande sucesso atingido pelo projeto SLOAN Digital Sky Survey [Thakar et al. 2008]. O projeto abriu o caminho para gerência de grande volumes de dados científicos em catálogos de objetos estelares armazenados em sistemas de bancos de dados. Novos levantamentos astronômicos, porém, tais como o Dark Energy Survey (DES) e Large Synoptic Survey Telescope (LSST), estão puxando os limites para catálogos com número de objetos próximos a ordem de grandeza do número de Avogrado. De forma a atender necessidades como essa novas técnicas de particionamento dos dados [LIROZ-GISTAU et al. 2012] e de processamento paralelo se fazem necessárias. Tem-se no contexto descrito acima um pano de fundo para um dos grandes desafios da computação, conforme proposto pela Sociedade Brasileira de Computação (SBC) [Lucena et al. 2006], no que se refere a gerência de grandes volumes de dados produzidos nas diversas disciplinas científicas como parte do processo investigativo. Este projeto propõe-se a investigar os seguintes problemas associados ao apoio na gerência do ciclo de vida da investigação científica in-silico. Primeiramente, vamos investigar a representação e gerência de hipóteses científicas. Este trabalho é o tema da tese de doutorado de Bernardo Nunes Gonçalves, sob a orientação do proponente deste projeto. Em segundo lugar, pretende-se investigar o gerenciamento de malhas produzidas por cálculos de elementos finitos. Este trabalho esta sendo desenvolvido pelo aluno de doutorado Ramon Gomes da Costa. Finalmente, pretende-se investigar a integração de sistemas de workflow científicos com o sistema de gerência de bancos de dados distribuídos. Este tema esta sendo desenvolvido em duas colaborações. O aluno Miguel Liroz-Gistau, doutorando da Universidade de Montpellier, orientado pela Profa Esther Pacitti, investiga estratégias de particionamento de dados do tipo catálogo de dados astronômicos. O trabalho desenvolvido por Liroz-Gistau esta inserido em projeto de colaboração internacional CNPq/INRIA: 490259/2009-0, Datluge - Gerência de Dados e Tarefas em Larga Escala. O aluno Douglas Ericson de Oliveira doutorando da Universidade Federal Fluminense e co-orientado pelo proponente e pela Profa. Maria Cristina Boeres, investigará o paralelismo de workflows científicos integrado ao particionamento de dados.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Doutorado: (4) . Integrantes: Fabio Andre Machado Porto - Coordenador / Douglas Ericson Marcelino de Oliveira - Integrante / Jean Louis Valentin - Integrante / Ramon Gomes Costa - Integrante / Miguel Liroz-Gistau - Integrante / Esther Pacitti - Integrante / Patrick Valduriez - Integrante / Bernardo Nunes Gonçalves - Integrante / Luiz Nicolaci da Costa - Integrante / Pablo Blanco - Integrante. Financiador(es): (CNPq) Conselho Nacional de Desenvolvimento Científico e Tecnológico - Bolsa. Número de produções C, T A: 11 / Número de orientações: 2
Membro: Fabio Andre Machado Porto.
4.   2013-2016. GX - Gerência de dados XML (FAPERJ, Edital Jovem Cientista do Nosso Estado)
Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (6) Doutorado: (4) . Integrantes: Vanessa Braganholo Murta - Coordenador / Daniel Cardoso Moraes de Oliveira - Integrante / Aline Marins Paes - Integrante / Luiz Augusto Matos da Silva - Integrante / Leonardo Gresta Paulino Murta - Integrante / Marta Lima de Queirós Mattoso - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
Membro: Vanessa Braganholo Murta.
5.   2013-Atual. Media Cloud: Panóptico de Fluxos Textuais na Sociedade Brasileira
Descrição: O Objetivo do Projeto Media Cloud é a estruturação de um processo contínuo de captação de uma miríade de dados de cunho textual (jurídicos, legislativos, midiáticos, acadêmicos, etc.) visando à realização de análises de cunho acadêmico, semântico, estatístico e orgânico, permitindo a construção de modelos panópticos para percepção e inferência sobre a conjuntura brasileira e análises preditivas.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (5) . Integrantes: Renato Rocha Souza - Integrante / Flavio Codeco Coelho - Coordenador / Elisa Mussumeci Bianor dos Santos - Integrante / Flávio Amieiro - Integrante / Eduardo Fonseca Mendes - Integrante. Financiador(es): Fundação Getúlio Vargas - Auxílio financeiro.
Membro: Renato Rocha Souza.
6.   2013-Atual. Núcleo de Análise e Modelagem de Dados
Descrição: O Núcleo de Análise e Modelagem de Dados (NAMD) desenvolve pesquisas e dá suporte tecnológico às atividades de analytics da EMAp e da FGV nas áreas de Processamento de Linguagem Natural, Machine Learning, Modelagem Matemática e Computação Científica. Dentre os projetos atualmente mantidos, podem-se listar: Planejamento, Operação, Manutenção e pesquisa com os dados da base Media Cloud Desenvolvimento da plataforma aberta de Processamento de Linguagem Natural PyPLN Manutenção da estrutura de servidores do projeto: Estudo Geoespacial da Inflação (com o IBRE) Participação no Projeto Supremo 2.0 (com a Escola de Direito - Rio) Participação no Projeto ?Digital Humanities and Declassification of Documents? (com Columbia University, CPDOC) Participação no Laboratório de Estudos Experimentais sobre Linguagem (LEEL) (com a Escola de Letras ? UFMG) Suporte de desenvolvimento de software no projeto Alerta Dengue (Com a Fiocruz) Suporte de desenvolvimento de software no projeto Alerta Influenza (Com a Fiocruz) Projeto Fronteiras da Modelagem Matemática (com a University of New South Wales) Suporte tecnológico ao Projeto de modelagem e análise dos dados de alunos do IDE Suporte tecnológico ao Projeto do Mestrado profissional em Data Science Suporte tecnológico na manutenção dos ambientes de simulação dos alunos de mestrado e doutorado (máquina virtual: alunos.namd.mat.br) Suporte ao Datathon BID-FGV 2016 (DINT e EMAp) ? usando Dados em Zyka e Chikungunya Os projetos desenvolvidos pelo NAMD têm conferido grande visibilidade à FGV e ajudado a solidificar a expertise em analytics da instituição como um todo. Dentre os projetos que geraram mais externalidades, podemos citar o projeto da Light (com a Escola de Direito), o projeto Alerta Dengue, e a firmatura de convênios com os tribunais de justiça do Rio e de São Paulo (TJRJ e TJSP). Mais recentemente, o projeto de inflação geoespacial em conjunto com o IBRE demandou o desenvolvimento de técnicas para avaliação da variação de preços por região, permitindo consultas espaciais. Para o próximo período, serão desenvolvidas as vententes de captura de preços online, trazendo uma nova forma de medir a inflação para o consumidor.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) . Integrantes: Renato Rocha Souza - Coordenador / Flavio Codeco Coelho - Integrante / Flávio Amieiro - Integrante / Eduardo Fonseca Mendes - Integrante.
Membro: Renato Rocha Souza.
7.   2013-2016. Projeto de Avaliação de Desempenho do Sistema de Saúde Brasileiro (PROADESS)
Descrição: O Projeto de Avaliação de Desempenho do Sistema de Saúde Brasileiro (PROADESS) é uma proposta de avaliação do desempenho do SUS desenvolvida por uma rede de pesquisadores vinculados a sete instituições brasileiras de pesquisa no campo da saúde coletiva, como alternativa ao Relatório Mundial de Saúde de 2000 da OMS. O modelo do PROADESS é resultado da revisão dos modelos de avaliação propostos por países como Canadá, Austrália e Reino Unido, cujos sistemas de saúde, à semelhança do caso brasileiro, baseiam-se nos princípios de acesso universal e integralidade dos serviços. A partir deste estudo, foi elaborada uma matriz conceitual que, partindo do princípio da equidade, tem como foco de análise os serviços de saúde, cujo desempenho depende da estrutura, do financiamento e da capacidade do sistema de atender, de forma equitativa, às necessidades de saúde da população.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (2) / Doutorado: (1) . Integrantes: Marcel de Moraes Pedroso - Integrante / Christovam Barcellos - Integrante / Francisco Viacava - Coordenador / Josué Laguardia - Integrante / Alicia Ugá - Integrante / Silvia Porto - Integrante / Cristina Maria Rabelais Duarte - Integrante / Jaime Gregorio Bellido - Integrante.
Membro: Marcel de Moraes Pedroso.
8.   2013-2016. Sistema de Indicadores de Saúde e Acompanhamento de Políticas do Idoso (SISAP-Idoso)
Descrição: O SISAP-Idoso ? Sistema de Indicadores de Saúde e Acompanhamento de Políticas do Idoso - busca dar resposta a esse cenário. Sua finalidade principal é disponibilizar, de forma universal, indicadores de diferentes dimensões da saúde dos idosos relacionando-os com políticas públicas. Nesse sentido, o Sistema compreende os seguintes objetivos centrais: 1. Oferecer aos gestores em saúde informações e indicadores que auxiliem a tomada de decisões e o planejamento de ações voltadas à população idosa, tanto no âmbito municipal como estadual; 2. Sistematizar e acompanhar as políticas, programas e instrumentos de gestão, como o Pacto pela Vida, relacionadas com a saúde do idoso; 3. Oferecer informações acerca das condições de saúde e qualidade de vida da população idosa nos diferentes níveis a pesquisadores e interessados na temática; 4. Propor indicadores diretos ou indiretos de monitoramento de metas e diretrizes pactuadas pelas políticas e programas nacionais e internacionais; 5. Disponibilizar o acesso livre e universal à informação em saúde.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (1) . Integrantes: Marcel de Moraes Pedroso - Integrante / Dalia Romero - Coordenador / Aline Marques - Integrante / Edgar Nunes de Moraes - Integrante / Flavia Lanna - Integrante.
Membro: Marcel de Moraes Pedroso.
9.   2013-2014. Técnicas de Transformação de Dados para Previsões de Séries Temporais por Meio de Redes Neurais
Descrição: Processo: E-26/111.386/2013 Programa: APQ1 2013/01 Valor financiado: R$13.000,00 No contexto de previsões de séries temporais por meio de mineração de dados, identificar se é necessário realizar transformações de dados na etapa de pré-processamento pode ser um passo fundamental para se atingir uma boa acurácia. Esta preocupação se torna maior, principalmente, no caso de utilização de redes neurais. Isto é decorrente ao fato de que a maioria dos métodos tradicionais de mineração de dados por meio de redes neurais fazem suposições que podem não ser válidas. O primeiro pressuposto é que as séries temporais são estacionárias, ou seja, suas propriedades estatísticas, tais como média e desvio padrão, não mudam ao longo do tempo. O segundo pressuposto é que elas têm homocedasticidade, i.e., a volatilidade destas séries temporais não varia. Na maioria das séries temporais macroeconômicas, por exemplo, estes pressupostos não são válidos. A consequência disto é que a capacidade de previsão de uma rede neural fica comprometida nesta situação. Assim, este projeto visa abordar o problema e estudar as séries temporais não-estacionárias com heterocedasticidade.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (3) . Integrantes: Eduardo Soares Ogasawara - Coordenador / Eduardo Bezerra - Integrante / Jorge de Abreu Soares - Integrante.
Membro: Eduardo Soares Ogasawara.

2012

1.   2012-Atual. Avaliação de artefatos computacionais
Descrição: Edital de Grupo de Pesquisa do CEFET/RJ 2012, 2013 e 2014: Valores financiados: R$2.949,63, R$129.404,74 e R$4.753,95. O desenvolvimento dos trabalhos de conclusão do curso (TCC) cobre várias tarefas: pesquisa bibliográfica, definição, escopo, modelagem, design e implementação da solução. Um produto importante de uma TCC geralmente envolve a elaboração de algum artefato computacional per se. Os alunos envolvidos em sua TCC têm que superar vários desafios. Geralmente é sua primeira grande experiência em termos de desenvolvimento de software. Observa-se que esses alunos enfrentam dificuldades técnicas, falta de experiência prática e também dificuldades administrativas para realizar trabalhos grupais. Apesar desses desafios, muitas ideias e produtos interessantes são desenvolvidos em toda a TCC. No entanto, em várias ocasiões, avaliações adequadas das soluções propostas e uma análise mais aprofundada dos resultados obtidos não são apresentadas nessa TCC. Uma das principais desvantagens é a falta de experiência dos alunos na realização de experimentos. Este projeto visa estudar abordagens ou estruturas simplificadas para apoiá-los na avaliação desses artefatos.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Eduardo Soares Ogasawara - Coordenador / João Roberto de Toledo Quadros - Integrante / Leonardo Lignani - Integrante / Joel dos Santos - Integrante.
Membro: Eduardo Soares Ogasawara.
2.   2012-2014. Bioknowlogy: Integração e Análise de Recursos Semânticos para o Estudo de Genes de Resistência a Antibióticos em Efluentes Hospitalares
Descrição: A Web semântica pode ser considerada como um dos desafios de pesquisa em Ciência da Computação, pois diz respeito à gestão da informação em grandes volumes de dados multimídia distribuídos. A área Biomédica tem tomado a frente de outras áreas científicas, no sentido de somar esforços para vencer o desafio da Web Semântica. Esta posição vanguardista tem sua razão de ser, pois para vários países as questões de saúde pública são questões importantes para a defesa nacional. Estes países vêm gradualmente investindo na detecção da presença de agentes biológicos, seja para saber se defender contra ataques intencionais, seja para a prevenção, ou inclusive combate e controle de epidemias. Alguns agentes biológicos são responsáveis por epidemias que afetam não só a saúde da população como também a economia do país. Por exemplo, a água poluída pode causar diversos efeitos prejudiciais à saúde humana sendo os patógenos bacterianos, encontrados na água e/ou alimentos, uma das principais fontes de morbidade e mortalidade em nosso meio. Neste sentido, este projeto, tem como foco Biológico, identificar genes de resitência a antibióticos em efluentes hospitalares da cidade do Rio de Janeiro. Para identificar os genes de resistência a antibióticos, o projeto pretende utilizar uma abordagem metagenômica, através do pirosequenciamento, que é considerada inovadora no Estado do Rio de Janeiro. Neste tipo de abordagem, gera-se uma grande massa de dados, que pela demanda natural da área, deve ser disponibilizado na Web Semântica. A publicação semântica dos dados presentes nos diversos bancos de dados sobre diferentes organismos já é uma tendência. No entanto, a associação destes recursos não é uma tarefa fácil. Assim sendo, através do presente projeto pretende-se investigar e propor abordagens no sentido de facilitar a associação entre os recursos descritos semanticamente e apoiar a decisão com base nestes recursos, tendo como cenário para o estudo dessas. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (5) Doutorado: (5) . Integrantes: Fabio Andre Machado Porto - Integrante / Ana Maria de Carvalho Moura - Integrante / Maria Claudia Cavalcanti - Coordenador / Walace Anacleto Pinheiro - Integrante / Fabio Faria da Mota - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
Membro: Fabio Andre Machado Porto.
3.   2012-2014. Desenvolvimento de Tesauros e Ontologias no escopo do Portal Semantico do CPDOC
Descrição: O Centro de Pesquisa e Documentação de História Contemporânea do Brasil (CPDOC) da Fundação Getulio Vargas (FGV) é considerado um centro de referência dedicado ao estudo e à preservação da memória do país ? particularmente dos anos 1930 em diante -, e é conhecido por abrigar e disponibilizar um importante acervo histórico documental. Este acervo é constituído de diferentes tipos de informação distribuídos em sistemas próprios, construídos de acordo com as especificações e necessidades demandadas por cada um destes tipos. Por se tratar de um mesmo universo de discurso, a saber, a história recente do Brasil, em um sistema heterogêneo e distribuído de arquivos, o uso de instrumentos de controle terminológico faz-se necessário, pois permite a seleção do conjunto de conceitos relevantes capazes de traduzir adequadamente o conteúdo das unidades documentais armazenadas nestes sistemas, de forma integrada e padronizada. Este artigo apresenta de maneira geral o projeto de criação de Tesauros Terminológicos que o CPDOC vem desenvolvendo, visando a aprimorar o tratamento das informações e, consequentemente, a estratégia de busca e interação em seu sistema de recuperação da informação.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Renato Rocha Souza - Coordenador / Suemi Higuchi - Integrante / Vanessa Matheus Cavalcante - Integrante / Renan Marinho de Castro - Integrante / Juliana Gagliardi - Integrante / Martina Spohr - Integrante / Daniele Chaves Amado - Integrante / Bianca Magalhães - Integrante. Número de produções C, T A: 4
Membro: Renato Rocha Souza.
4.   2012-Atual. Estimação de modelos esparsos com dependência
Descrição: Esparsidade é uma das formas de lidar com problemas de estimação de modelos em alta dimensão, onde o número de parâmetros é maior do que o número de observações disponível. Mais precisamente, modelos esparsos são aqueles cujo vetor de parâmetros possui apenas alguns valores diferentes de zero. Existem diversas técnicas de regularização, para estimar tais modelos, dentre elas uma das mais populares é o LASSO. O LASSO (Least Absolute Selection and Shrinkage Operator) impõe uma penalização L1 nos parâmetros e possui a propriedade de recuperar a esparsidade do modelo. O LASSO, assim como outras técnicas, foram desenvolvidas sob condições clássicas de modelos de regressão linear, que não são adequadas para dados com dependência, tais como séries temporais e modelos longitudinais. Neste projeto, buscamos (1) estudar as propriedades do LASSO e métodos derivados em séries temporais sob diversas especificações; (2) propor extensões às técnicas existentes e novas técnicas para estimação esparsa sob dependência; (3) desenvolver técnicas para seleção dos hiperparâmetros; (4) Desenvolver extensões do LASSO para modelos painel com muitos efeitos fixos.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Eduardo Fonseca Mendes - Integrante / MEDEIROS, MARCELO C. - Coordenador / Ricardo Masini - Integrante. Número de produções C, T A: 6
Membro: Eduardo Fonseca Mendes.
5.   2012-Atual. Gerência, Integração e Aplicações em Big Data
Descrição: Organizações buscam intensivamente a geração de vantagem competitiva para posicionamento de destaque no ramo onde atuam. Revela-se como condição inegociável que elas continuamente conheçam a si mesmas - o seu modus operandi interno - bem como sua posição no mercado frente aos seus clientes e fornecedores. Suas áreas de Planejamento Estratégico, Marketing, Finanças e Contabilidade, Logística e Controle de Estoque e Gestão de Pessoas utilizam como matéria-prima de suas atividades ou dados estruturados pelos sistemas de informações empresariais, tais como sistemas integrados de gestão (ERP, CRM ou SCM), ou sistemas legados, soluções baseadas em ambiente Web e/ou móvel, ou mesmo documentos e recursos baseados em texto, como e-mails ou postagens de clientes em mídias sociais. Consequência natural desse contexto, além da urgência pelo correto armazenamento desses dados, é a necessidade de que eles sejam devidamente tratados, transformando o chamado "oceano de dados" em informação e conhecimento, em um processo de "destilação de dados". Todavia, a produção de informação e conhecimento não leva em conta exclusivamente fontes provenientes de tais sistemas de informação organizacionais. Chama especial atenção a integração de diversas fontes de dados, especialmente as externas às organizações, que por um lado guardam uma inegável riqueza semântica, a qual se contrapõe ao cuidado necessário com o resultado do processo - a qualidade dos dados integrados. Atenção especial deve ser dada a essa etapa, sob o risco de geração de resultados sem aplicabilidade direta aos seus clientes. Nesse cenário, questões importantes demandam respostas convincentes, tais como as relativas à forma de organização dos dados - incluindo abordagens baseadas em sistemas de armazenamento distribuídos, sistemas gerenciadores de bancos de dados relacional-objeto, NoSQL e newSQL - ou mesmo relativas ao seu processamento em ambientes de alto desempenho. Com o objetivo de auxiliar esse processo de forma determinante, valemo-nos das soluções ofertadas pelas áreas de Ciência de Dados e de Inteligência e Análise de Negócios para o tratamento de grandes bases e bancos de dados. A área de Ciência de Dados traz consigo interessantes conceitos que podem ser úteis nesse contexto. Como exemplo podemos citar: i) técnicas de modelagem conceitual com workflows e ontologias, aplicadas sobre dados heterogêneos em forma e volume como os de big data; ii) processamento em ambientes de alto desempenho para a obtenção de análise em larga escala e iii) implementações em sítios de execução usando abordagens baseadas em Map-Reduce, Spark ou Álgebra de Workflows, independentemente instanciados por plataformas tais como clusters, grades, nuvens, entre outros. Tais conceitos potencializam sobremaneira os resultados que as organizações podem obter - e consequente beneficiarem-se. Aliam-se a tal cabedal de possibilidades as consolidadas técnicas de aprendizado de máquina, como mineração de dados e textos, redes neuronais artificiais ou algoritmos evolucionários. Interessantes categorias de problemas específicos podem se valer desse acervo teórico-prático por demandar algoritmos diferenciados para gestão destes dados, como os envolvendo séries espaço-temporais; a mineração de textos e ontologias para a realização de trabalhos de anotações de texto; ou a mineração de processos de negócio. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Mestrado acadêmico: (6) . Integrantes: Jorge de Abreu Soares - Coordenador / Eduardo Soares Ogasawara - Integrante / Kele Teixeira Belloze - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro. Número de produções C, T A: 15 / Número de orientações: 20
Membro: Jorge de Abreu Soares.
6.   2012-2015. GExProv - Gerência de experimentos científicos guiada por proveniência (CNPq, Edital Universal 14/2011 - Faixa C - de R$50.000,01 a R$150.000,00)
Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (6) Doutorado: (7) . Integrantes: Vanessa Braganholo Murta - Integrante / Alexandre Lima - Integrante / Kary Ann Ocana - Integrante / Leonardo Gresta Paulino Murta - Integrante / Marta Lima de Queirós Mattoso - Coordenador. Financiador(es): (CNPq) Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
Membro: Vanessa Braganholo Murta.
7.   2012-Atual. Modelagem e Simulação de Padrões de Mobilidade Humana com Aplicações ao Controle de Epidemias e Previsão de Fluxo Urbano
Descrição: Pela primeira vez no Brasil, uma operadora de telefonia vai conceder os seus dados de tráfego para a realização de pesquisa sobre mobilidade humana. Estes dados contêm a localização da antena que realizou a chamada, efetuada ou recebida, por uma estação móvel (telefone celular). O objetivo principal deste projeto é realizar a integração de diversas bases de dados para o desenvolvimento de modelos do processo de mobilidade humana em diferentes escalas de tempo e em duas escalas espaciais: Estado do Rio de Janeiro: e Região Metropolitana.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) Doutorado: (2) . Integrantes: Moacyr Alvim Horta Barbosa da Silva - Coordenador / Alexandre Evsukoff - Integrante / Antonio Carlos Saraiva Branco - Integrante / Nelson Francisco Favilla Ebecken - Integrante. Financiador(es): FAPERJ - Auxílio financeiro.
Membro: Moacyr Alvim Horta Barbosa da Silva.
8.   2012-2013. Paralelização de Workflows Científicos para Apoiar Aplicações de e-Science
Descrição: Processo: E-26/112.442/2012 Programa: Auxilio Instalação 2012/01 Valor financiado: R$4.650,00 Os workflows científicos emergiram como uma abstração para estruturar experimentos científicos baseados em simulações computacionais. Em muitas situações, estes workflows são intensivos, seja computacionalmente seja quanto em relação à manipulação de dados, exigindo a execução em ambientes de processamento de alto desempenho. Comumente a paralelização da execução destes workflows científicos requer programação trabalhosa, de modo ad hoc e em baixo nível de abstração, o que torna difícil a exploração das oportunidades de otimização. Recentemente, o pesquisador propôs em sua tese de doutorado o uso de abordagem algébrica para workflows científicos como uma forma de ascender o nível de abstração para especificar workflows científicos visando à diminuição da complexidade de paralelização destes workflows. Entretanto, embora tenha alcançado resultados promissores, o estudo foi feito utilizando-se um modelo de execução específico para clusters homogêneos em ambientes de disco compartilhado, o que nem sempre é uma realidade para áreas científicas reais como bioinformática e astronomia. Assim, torna-se necessário realizar novos estudos e explorar os desafios inerentes a ambientes diferenciados, o que inclui cenários como discos não compartilhados e dados geograficamente dispersos, heterogeneidade e dinamismo computacional (entrada e saída de recursos computacionais a qualquer momento). Este projeto inclui pesquisa teórica e experimental visando a avaliar o uso de abordagens que viabilizem a paralelização de workflows científicos. O projeto prevê estudos destas abordagens no apoio a aplicações reais em e-Science como, por exemplo, bioinformática, mineração de dados e astronomia nos próximos dois anos.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Eduardo Soares Ogasawara - Coordenador. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
Membro: Eduardo Soares Ogasawara.
9.   2012-2013. Replicação de Configuracão de Base de Dados
Descrição: No contexto de aplicacões B2B, configurar serviços para clientes é uma etapa importante da maioria de pacotes de software. A validação de cada configuração inclui teste em diferentes ambientes. Este projeto objetiva prover um mecanismo de replicacão de configuração entre ambientes de teste eliminando o trabalho humano de redigitação em cada um dos ambientes das configuracões.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (1) . Integrantes: Fabio Andre Machado Porto - Coordenador / Douglas Ericson Marcelino de Oliveira - Integrante / Frederico Correa da Silva - Integrante.
Membro: Fabio Andre Machado Porto.

2011

1.   2011-2013. BioKnowlogy: Integração e Análise de Recursos Semânticos para o Estudo de Genes de Resistência a Antibióticos em Efluentes Hospitalares
Descrição: Descrição: Este projeto, tem como foco Biológico, identificar genes de resistência a antibióticos em efluentes hospitalares da cidade do Rio de Janeiro. Para identificar os genes de resistência a antibióticos, o projeto pretende utilizar uma abordagem metagenômica, através do pirosequenciamento, que é considerada inovadora no Estado do Rio de Janeiro. Neste tipo de abordagem, gera-se uma grande massa de dados, que pela demanda natural da área, deve ser disponibilizado na Web Semântica. A publicação semântica dos dados presentes nos diversos bancos de dados sobre diferentes organismos já é uma tendência. No entanto, a associação destes recursos não é uma tarefa fácil. Assim sendo, através do presente projeto pretende-se investigar e propor abordagens no sentido de facilitar a associação entre os recursos descritos semanticamente e apoiar a decisão com base nestes recursos, tendo como cenário para o estudo dessas abordagens, o estudo dos genes de resistência a antibióticos em efluentes hospitalares do SUS, no Estado do Rio de Janeiro.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (3) / Doutorado: (4) . Integrantes: Kele Teixeira Belloze - Integrante / Maria Claudia Reis Cavalcanti - Coordenador / Ana Maria Moura - Integrante / Fábio Porto - Integrante / Fábio Faria da Mota - Integrante / Oswaldo Gonçalves Cruz - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
Membro: Kele Teixeira Belloze.
2.   2011-2014. Descrição, Publicação e Acesso a Conjunto de LInked Data
Descrição: Os princípios que regem a produção de Linked Data fornecem subsídios para a publicação e conexão de dados por meio da infraestrutura fornecida pela Web. Do ponto de vista do desenvolvimento de aplicativos, sugerem uma forma tanto para publicar bancos de dados na Web quanto para facilitar a interoperabilidade entre bancos de dados. Porém, o armazenamento e acesso a grandes conjuntos de triplas RDF, organizados segundo os princípios de Linked Data, representam um grande desafio. De fato, nem os repositórios especializados em triplas RDF, nem os processadores de consultas SPARQL escalam para o volume de dados desejado. Novos paradigmas devem então ser investigados para viabilizar este cenário. Computação em nuvem apresenta-se como uma opção na medida em que provê armazenamento e poder de processamento em larga escala e sob demanda. O objetivo geral do projeto consiste em desenvolver métodos, ferramentas e experimentos envolvendo a descrição, publicação e acesso a conjuntos de Linked Data. No que tange a descrição de conjuntos de Linked Data, o projeto enfatiza a qualidade do conjunto final de triplas RDF, medida tanto pela facilidade em identificar a semântica das classes e propriedades incluídas na descrição do conjunto de triplas RDF, via as restrições de integridade da ontologia de aplicação, quanto pela estratégia adotada para gerar as URIs que identificam os recursos descritos. No contexto de publicação de conjuntos de Linked Data, o projeto expande a estratégia de triplificação tradicional para também publicar triplas RDF em páginas Web estáticas com RDFa embutido. Explora também o uso de plataformas de computação em nuvem como opção para armazenamento e acesso a grandes grafos RDF, enfatizando técnicas de indexação. Quanto a acesso a conjuntos de Linked Data, o projeto explora métodos para otimização de consultas SPARQL no contexto de processamento exploratório e no contexto de processamento mediado. Aborda também métodos para otimizar consultas em SPARQL. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (6) Doutorado: (7) . Integrantes: Fabio Andre Machado Porto - Integrante / jose Antônio Fernandes de Macedo - Integrante / Vania Vidal - Integrante / Marco Antônio Casanova - Coordenador / Ana Maria de Carvalho Moura - Integrante / Karim Breitman - Integrante / Antonio Luz Furtado - Integrante. Financiador(es): (CNPq) Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro. Número de produções C, T A: 2
Membro: Fabio Andre Machado Porto.
3.   2011-2016. MEMORE Um Ambiente para Coleta e Mineração de Dados sobre a Utilização de Computadores na Educação
Descrição: Os constantes avanços das Tecnologias da Informação e Comunicação (TICs) têm proporcionado diferentes recursos computacionais com aplicação prática e robusta em diversos segmentos da Sociedade. Em particular, a utilização do computador como ferramenta educacional é um tema de grande relevância e que tem sido objeto de pesquisa multidisciplinar envolvendo prioritariamente as áreas da Educação e da Computação. Neste contexto, o governo federal brasileiro lançou o Programa Um Computador por Aluno (PROUCA) que vem distribuindo laptops, para uso educacional nas escolas, como estímulo à inclusão digital de discentes, docentes e gestores. Embora várias escolas tenham sido contempladas pelo programa, o PROUCA carece de instrumentos que permitam às instâncias gestoras e de governo conhecer, acompanhar e avaliar ações pedagógicas vinculadas à utilização dos laptops em sala de aula e em atividades extraclasse. Diante deste cenário, o presente projeto tem como objetivo desenvolver um ambiente computacional, denominado MEMORE Mecanismo de Monitoramento Remoto, para captação e análise de dados acerca da utilização de computadores nas escolas, em busca de padrões e informações sobre comportamentos e práticas pedagógicas que possam apoiar tanto o estudo da complexidade e amplitude do PROUCA quanto a definição de estratégias e políticas educacionais nacionais, regionais e locais baseadas no uso das TICs. Para tanto, o MEMORE deverá ser modelado com base em técnicas de Inteligência Artificial, Mineração de Dados e Engenharia de Software. Sua arquitetura permitirá a replicação e a implantação do ambiente nas diversas escolas vinculadas ao PROUCA, proporcionado assim uma integração incremental e gradual de informações oriundas de diferentes contextos geográficos. Cabe ressaltar ainda que, ao permitir captar e analisar informações sobre o uso de recursos computacionais por alunos e professores, o referido ambiente possui potencial para ser aplicado de forma integrada a outras proposta.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Jorge de Abreu Soares - Integrante / Isabel Fernandes de Souza - Integrante / Claudia Ferlin - Integrante / Ronaldo Ribeiro Goldschmidt - Coordenador / Maria Claudia Reis Cavalcanti - Integrante. Número de produções C, T A: 6 / Número de orientações: 21
Membro: Jorge de Abreu Soares.
4.   2011-Atual. Modelos de Cointegração com Transição Suave
Descrição: Modelos de transição de regimes são popularmente usados para analisar séries univariads e multivariadas, em particular para capturar assimetrias. Na maioria dos casos, estes modelos são aplicados a séries estacionárias onde todos os regressores são fracamente exógenos. Estudos anteriores consideraram modelos de cointegração dinâmicos onde a variável de transição é não estacionária. Neste trabalho estudamos cointegração com transição suave, onde a variável de transição é estacionária. Nós derivamos o modelo, testes de linearidade e propriedade assintóticas dos estimadores de mínimos quadrados não-lineares (tradicional e dinâmico). Este modelo é interessante para modelar, por exemplo, preços usando a volatilidade do preço de comodities como variável de transição.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Eduardo Fonseca Mendes - Integrante / MEDEIROS, MARCELO C. - Coordenador / OXLEY, LES - Integrante. Número de produções C, T A: 1
Membro: Eduardo Fonseca Mendes.
5.   2011-Atual. PyPLN - Distributed Pipeline for Natural Language Processing
Descrição: PyPLN é um projeto que envolve arcabouço teórico, metodológico e tecnológico para análises textuais baseadas em corpora. Envolve atividades de mineração de textos, topic modellng, classificação automática (clustering), extração de conhecimento com objetivo de criação de ontologias, estudos de estilo e análise de mídia. http://demo.pypln.org/. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) . Integrantes: Renato Rocha Souza - Coordenador / Heliana Ribeiro de Mello - Integrante / Flavio Codeco Coelho - Integrante / Flávio Amieiro - Integrante / Guilherme Passos - Integrante. Financiador(es): Fundação Getúlio Vargas - Auxílio financeiro. Número de produções C, T A: 6 / Número de orientações: 1
Membro: Renato Rocha Souza.
6.   2011-Atual. Rede de Cooperação Acadêmica em Ciência da Computação
Descrição: Esta proposta descreve uma solicitac ̧a ̃o de apoio financeiro a projetos conjuntos de pesquisa cient ́ıfica e tecnolo ́gica em 4 diferentes a ́reas da Ci?encia da Computa ̧ca ̃o que visa estimular ou aprofundar a formac ̧a ̃o po ́s-graduada e a mobilidade docente e discente. Os projetos conjuntos aqui descritos, agrupados em uma so ́ proposta como exigido no edital, t?em o objetivo de promover a consolida ̧ca ̃o de Programa de Mestrado e Doutorado em Ci?encia da Computa ̧ca ̃o da Universidade Federal do Ceara ́ (MDCC-UFC) por meio da cooperac ̧a ̃o inter-regional entre 4 de seus grupos de pesquisa e seus cong?eneres de programas consolidados de institui ̧co ̃es nacionais de ensino superior e de pesquisa do Estado do Rio de Janeiro. Como resultados do Programa, espera-se que haja fortalecimento da intera ̧ca ̃o cient ́ıfico acad?emica de modo a constituir redes de cooperac ̧a ̃o, o aumento na formac ̧a ̃o e na capacita ̧ca ̃o de recursos humanos, o aumento da produ ̧ca ̃o t ́ecnico-cient ́ıfica dos grupos de pesquisa, o fortalecimento de linhas de pesquisa. Considerando-se que parte significativa dos membros das equipes do MDCC-UFC ́e formada por rec ́em- doutores com potencial para carreira cient ́ıfica, as atividades dos projetos conjuntos contribuira ̃o para uma melhor distribui ̧ca ̃o regional dos nu ́cleos de excel?encia em pesquisas no pa ́ıs. A descric ̧a ̃o da proposta esta ́ organizada de forma a fornecer as informa ̧co ̃es separadamente por grupo de pesquisa, sempre que for pertinente essa separa ̧ca ̃o.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Fabio Andre Machado Porto - Integrante / Bruno Richard Schulze - Integrante / jose Antônio Fernandes de Macedo - Coordenador / Vania Vidal - Integrante / Marco Antônio Casanova - Integrante. Financiador(es): (CNPq) Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
Membro: Fabio Andre Machado Porto.
7.   2011-Atual. Supremo em Números
Descrição: O objetivo do projeto Supremo em Números é fundamentar a argumentação, quantitativa e estatisticamente, sobre a natureza, função e consequências da atuação do STF na implementação do Estado Democrático de Direito no Brasil. A pesquisa visa a aplicação de técnicas de processamento de linguagem natural e visualização de informações para subsidiar as análises jurídicas. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Renato Rocha Souza - Integrante / Flavio Codeco Coelho - Integrante / Pablo Camargo Cerdeira - Integrante / Ivar A. Hartmann - Coordenador. Financiador(es): Fundação Getúlio Vargas - Remuneração. Número de produções C, T A: 2
Membro: Renato Rocha Souza.
8.   2011-Atual. Teoria e Aplicações de Misturas de Especialistas
Descrição: Misturas de especialistas (ou misturas-de-regressões, mistura de modelos condicionais) são modelos de mistura onde o objetivo é modelar a distribuição condicional de um vetor aleatório Y condicional em outro vetor X, usando pesos que dependem do valor de X. Estes modelos possuem diversas propriedades interessantes, tais como aproximação universal de densidades e taxas de convergência rápidas; são facilmente estimados utilizando algoritmos EM e métodos variacionais; e se [X,Y] é distribuído como uma mistura de modelos, a distribuição condicional de Y|X é uma mistura de especialistas. Neste projeto eu busco entender propriedades de convergência dessa classe de modelos e desenvolver técnicas para seleção do modelo.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Doutorado: (1) . Integrantes: Eduardo Fonseca Mendes - Coordenador / JIANG, WENXIN - Integrante. Número de produções C, T A: 1
Membro: Eduardo Fonseca Mendes.

2010

1.   2010-2011. CiclExp - Apoio ao Ciclo de vida de Experimentos (CNPq, Edital Universal)
Descrição: Para que experimentos científicos em larga escala possam ser gerenciados, é ne-cessário que um conjunto de funcionalidades esteja presente. Dentre estas, estão o apoio à concepção dos workflows científicos e sua posterior instanciação num SGWfC (Sistema de Gerência de Workflows Científicos), a reutilização de workflows previamente concebidos por outros cientistas, o controle sobre a evolução das diferentes versões dos workflows e a coleta de informações que permitam identificar a proveniência dos dados gerados pela execução dos workflows científicos. Em particular é muito importante que a exploração visual de dados resultantes de workflows esteja associada a dados de proveniência do workflow. É fundamental que essas funcionalidades estejam atreladas ao experimento científico que está sendo conduzido por uma equipe de cientistas.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (3) / Mestrado acadêmico: (3) / Doutorado: (4) . Integrantes: Vanessa Braganholo Murta - Integrante / Cláudia Werner - Integrante / Leonardo Gresta Paulino Murta - Integrante / Marta Lima de Queirós Mattoso - Coordenador. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro. Número de produções C, T A: 9
Membro: Vanessa Braganholo Murta.
2.   2010-2013. Dataluge - Gerência de Dados e Tarefas em Larga Escala (CNPq/INRIA, Edital CNPq Nº 015/2009)
Descrição: O grande volume de dados e tarefas que representam experimentos científicos requerem o uso de ambientes de computação com processamento de alto desempenho (PAD). Esses ambientes também vêm evoluindo em larga escala e em novas arquiteturas. Vêm surgindo grids e nuvens de computação (cloud computing)com com milhares e milhões de unidades de processamento. O uso desse novo ambiente computacional de PAD apresenta muitos desafios. Esses desafios estão relacionados com a gerência de recursos em larga escala (tanto de processadores quanto de dados e tarefas). Nessa escala, não se pode assumir que todos os nós estarão em pleno funcionamento e torna-se necessário se preparar para nós que saem e entram no sistema. Dentre as dificuldades dos ambientes PAD, podemos destacar o alto custo e complexidade dos supercomputadores, a espera em filas de componentes de grid e a abordagem proprietária das nuvens computacionais. Essa complexidade tem levado ao uso de novas abordagens híbridas envolvendo uma combinação desses ambientes, como, por exemplo, uma nuvem híbrida. O uso desses ambientes requer novos algoritmos de fragmentação de dados e tarefas, de escalonamento, de caching, de tolerância a falhas e de agregação de resultados, além de testes de avaliação. Além disso, devido à larga escala, a incerteza de dados, em especial ao analisar os dados de proveniência dos experimentos científicos, deve ser considerada.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Especialização: (0) / Mestrado acadêmico: (2) / Mestrado profissional: (0) / Doutorado: (2) . Integrantes: Vanessa Braganholo Murta - Integrante / Alexandre Lima - Integrante / Esther Pacitti - Integrante / Patrick Valduriez - Integrante / Reza Akbarinia - Integrante / Eduardo Almeida - Integrante / Fábio Porto - Integrante / Marta Lima de Queirós Mattoso - Coordenador. Financiador(es): Institut National de Recherche En Informatique - Auxílio financeiro / Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro.
Membro: Vanessa Braganholo Murta.
3.   2010-Atual. Laboratório de Estudos Empíricos e Experimentais da Linguagem
Descrição: O Laboratório de Estudos Empíricos e Experimentais da Linguagem - LEEL - tem por missão fomentar a inovação metodológica na pesquisa da língua em uso, apoiando projetos de copilação e estudos de corpora e projetos experimentais sobre a linguagem.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Renato Rocha Souza - Integrante / Heliana Ribeiro de Mello - Coordenador / Tommaso Raso - Integrante / Maurício Barcellos Almeida - Integrante.
Membro: Renato Rocha Souza.
4.   2010-2014. MIST - Mineração de Imagens, Som e Texto nos acervos do CPDOC
Descrição: O projeto MIST: Mineração em Imagens, Som e Texto para Recuperação Inteligente de Documentos, foi criado ao identificar a oportunidade de aplicar a expertise da Escola de Matemática Aplicada no desenvolvimento de técnicas de inteligência computacional às bases de dados do CPDOC, tendo como produtos novas formas de lidar com o amplo acervo.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Renato Rocha Souza - Integrante / Asla Medeiros e Sá - Coordenador / Paulo Cezar Pinto Carvalho - Integrante / Moacyr Alvim Horta Barbosa da Silva - Integrante / Alexandre Rademaker - Integrante.
Membro: Renato Rocha Souza.
5.   2010-2011. Pesquisa e Desenvolvimento de Sistema de Informações Geográficas para a Secretaria de Direitos Humanos baseado em padrões abertos
Descrição: Desenvolvimento de um Sistema de Informações Geográficas, no formato de Servidor de Mapas, em ambiente web para fins específicos de elaboração do Marco Referencial Nacional de Direitos Humanos. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) . Integrantes: Marcel de Moraes Pedroso - Coordenador. Financiador(es): Secretaria de Direitos Humanos da Presidência da República - Cooperação. Número de produções C, T A: 1
Membro: Marcel de Moraes Pedroso.
6.   2010-Atual. Programa Ecologico de Longa Duração (PELD) Guanabara
Descrição: O PELD GUANABARA visa um melhor entendimento da estrutura e do funcionamento do ecossistema da Baia de Guanabara e de suas respostas aos impactos antrópicos e climáticos. Além da contribuição para ecologia marinha, este projeto também avaliará se as medidas mitigadoras que estão sendo tomadas para a Baia de Guanabara com o Programa de Despoluição serão suficientes para atender as exigências do comitê organizador da Olimpíada em 2016. Dentro dessa ótica, torna-se essencial que o elenco de variáveis bióticas e abióticas que serão introduzidas na pesquisa proposta seja analisado de maneira contínua ao longo de séries temporais suficientemente extensas. Somente uma pesquisa de longa duração permitirá alcançar um conhecimento suficiente da variabilidade dos sistemas e sua evolução frente às diversas agressões antrópicas, sejam elas de curto prazo (impacto agudo de poluentes, do tipo derrame), médio prazo (ação crônica dos efluentes domésticos e industriais), ou longo prazo (aquecimento global). Constitui assim um objetivo geral, estabelecer, por meio de estudo contínuo de longo prazo, e de experiências in situ e in vitro um prognóstico da tendência evolutiva desse ecossistema a partir da elaboração de uma base de dados relacional e de um modelo ecológico de previsão.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Fabio Andre Machado Porto - Integrante / Maira Poltosi - Integrante / Frederic Valentin - Integrante / Jean Louis Valentin - Coordenador. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro. Número de produções C, T A: 1
Membro: Fabio Andre Machado Porto.
7.   2010-2013. QLX - Viabilizando consultas a grandes volumes de dados XML (FAPERJ, Edital Jovem Cientista do Nosso Estado)
Descrição: O volume de dados XML disponíıvel atualmente vem crescendo cada vez mais. Este fato faz com que surja a necessidade de mecanismos eficientes de consulta e acesso a dados XML. Existem vários trabalhos na literatura que lidam com o problema de processar consultas sobre dados XML. Nesses trabalhos, o foco tem sido dado a bases de dados locais, métodos de acesso, álgebras para consulta, entre outros. No entanto, vários problemas permanecem em aberto. O primeiro deles refere-se a processamento de consultas sobre bases XML distribuídas. Apesar de existirem propostas de fragmentação para documentos XML, o processamento de consultas neste cenário ainda não está bem resolvido. O segundo refere-se à semântica das consultas. Em várias situações, os documentos XML possuem informações implícitas que poderiam ser exploradas se a linguagem de consulta permitisse algum tipo de inferência sobre o conteúdo do documento. Nesse projeto, pretendemos contribuir na solução destes problemas.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (5) / Doutorado: (1) . Integrantes: Vanessa Braganholo Murta - Coordenador / Carla Amaral de S. Rodrigues - Integrante / Tatiane Lima da Silva - Integrante / Diego Mury Gomes de Lima - Integrante / Alessandréia Marta de Oliveira - Integrante / Leonardo Gresta Paulino Murta - Integrante / Marta Lima de Queirós Mattoso - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro. Número de produções C, T A: 6 / Número de orientações: 4
Membro: Vanessa Braganholo Murta.

2009

1.   2009-Atual. Laboratorio Olimipco
Descrição: Desenvolvimento do laboratório Olimpico para desenvolvimento e pesquisa em esportes de alto rendimento. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Fabio Andre Machado Porto - Coordenador / Daniele Palazzi - Integrante / Frederico Correa da Silva - Integrante / Luis Eduardo Viveiro de Castro - Integrante / Luis Claudio Cameron - Integrante / Bassini, Adriana - Integrante / Marcos do Couto Bezerra Cavalcanti - Integrante. Financiador(es): Financiadora de Estudos e Projetos - Auxílio financeiro. Número de produções C, T A: 2
Membro: Fabio Andre Machado Porto.
2.   2009-2010. SARAVA - P2P data access for online communities
Descrição: Programme INRIA "Equipes Associées" - Colaboração Internacional FR-BR The general problem we address is P2P data sharing for online communities, by offering a high-level network ring across distributed data source owners. The major advantage of P2P is a completely decentralized approach to data sharing which does not require centralized administration. Users may be in high numbers and interested in different kinds of collaboration and sharing their knowledge, ideas, experiences, etc. Data sources can be in high numbers, fairly autonomous, i.e. locally owned and controlled, and highly heterogeneous with different semantics and structures. What we need then is new, decentralized data management techniques that scale up while addressing the autonomy, dynamic behavior and heterogeneity of both users and data sources. In this context, we focus on two major problems: query processing with uncertain data and management of scientific workflows. The two teams involved in this project have a long experience of success collaboration (in previous CNPq-INRIA and CAPES-COFECUB projects) and complementary expertise which make us quite confident in how to address the problems.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) Doutorado: (2) . Integrantes: Vanessa Braganholo Murta - Integrante / Alexandre Lima - Integrante / Esther Pacitti - Integrante / Patrick Valduriez - Integrante / Marta Lima de Queirós Mattoso - Coordenador. Financiador(es): Institut National de Recherche en Informatique et en Automatique - Siège - Auxílio financeiro. Número de produções C, T A: 2 / Número de orientações: 1
Membro: Vanessa Braganholo Murta.

2008

1.   2008-2011. Desenvolvimento de metodologias para indexação automática utilizando sintagmas nominais e outras instâncias sintáticas
Descrição: Projeto de mini-laboratório para o desenvolvimento de metodologias para indexação automática utilizando sintagmas nominais e outras instâncias sintáticas, no escopo do Edital MCT/CNPq N º 06/2008 ? Jovens Pesquisadores. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (1) Doutorado: (3) . Integrantes: Renato Rocha Souza - Coordenador. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro. Número de produções C, T A: 3 / Número de orientações: 1
Membro: Renato Rocha Souza.
2.   2008-2009. Desenvolvimento e Aplicação de Tecnologias Inovadoras na Educação à Distância (EaD) com vistas à formação de Conselheiros de Direitos e Tutelares sobre Orçamento Criança e Adolescente
Descrição: Termo de Cooperação com a Secretaria de Direitos Humanos da Presidência da República para Pesquisa, Desenvolvimento e Aplicação de Tecnologias Inovadoras em Educação à Distância (EaD) com vistas à formação de Conselheiros de Direitos e Tutelares sobre Orçamento Criança e Adolescente.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (10) / Especialização: (2) / Mestrado acadêmico: (1) / Doutorado: (1) . Integrantes: Marcel de Moraes Pedroso - Coordenador / Austregésilo Ferreira de Melo - Integrante / Perla Ribeiro - Integrante / Francisco Jose Sadeck Filho - Integrante. Financiador(es): Secretaria de Direitos Humanos da Presidência da República - Cooperação.
Membro: Marcel de Moraes Pedroso.
3.   2008-2009. Grupo de Pesquisa em Economia e Políticas Públicas
Descrição: Estudos sobre eficiência do SUS por intermédio da utilização de Data Envelopment Analysis (DEA). Situação: Em andamento; Natureza: Pesquisa. Integrantes: Marcel de Moraes Pedroso - Coordenador.
Membro: Marcel de Moraes Pedroso.

2007

1.   2007-2009. Appraisal: Uma Ferramenta de Imputação de Dados Ausentes
Descrição: Desenvolvimento de uma ferramenta de imputação de dados ausentes utilizando técnicas de workflow científico.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Jorge de Abreu Soares - Coordenador / Claudia Ferlin - Integrante / Ronaldo Ribeiro Goldschmidt - Integrante. Número de produções C, T A: 1
Membro: Jorge de Abreu Soares.
2.   2007-2009. Gerenciamento de Dados: de requisitos até distribuição (FAPERJ, Edital Primeiros Projetos)
Descrição: O gerenciamento de dados pode ser visto sob vários aspectos: desde o levantamento dos requisistos do sistema que dará origem aos dados, até aspectos de desempenho e armazenamento eficiente de dados. Este projeto trata do gerenciamento de dados sob vários aspectos. Os objetivos principais são: (1) propor algoritmos que façam a distribuição e localização automática de consultas a bases XML distribuídas, e que façam também a composição do resultado final para ser apresentado ao usuário; (2) definir um mecanismo de armazenamento para documentos XML ativos que suporte chamadas aos serviços Web embutidos em tais documentos; (3) dar suporte ao levantamento de requisitos de sistemas de forma mais eficaz e intuitiva para o usuário.A metodologia a ser utilizada neste projeto envolve o estudo das áreas relacionadas aos objetivos do projeto, definição de modelos, realização de experimentos práticos e verificação teórica dos resultados.Como resultados deste projeto, esperam-se publicações em veículos de boa qualidade durante o tempo de vigência do projeto e a formação de pelo menos três alunos de mestrado e publicações envolvendo a equipe, principalmente os alunos de mestrado.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (3) . Integrantes: Vanessa Braganholo Murta - Coordenador / Guilherme Coelho de Figueiredo - Integrante / Cláudio Ferraz - Integrante / Viviane Laporti - Integrante. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro. Número de produções C, T A: 2 / Número de orientações: 3
Membro: Vanessa Braganholo Murta.
3.   2007-2009. GExp - Gerência de experimentos científicos em larga escala (CNPq, Edital Grandes Desafios)
Descrição: A motivação principal desse projeto está no apoio computacional ao desenvolvimento de ciência em larga escala. Mais especificamente visamos a enfrentar os desafios na gerência dos recursos distribuídos inerentes ao desenvolvimento de ciência hoje em áreas como bioinformática e de engenharia do petróleo. Essa motivação está explicitamente identificada no desafio 2 dos Grandes Desafios da Computação onde é dito que: O objetivo deste desafio é criar, avaliar, modificar, compor, gerenciar e explorar modelos computacionais para todos esses domínios e aplicações.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (1) / Mestrado acadêmico: (2) / Doutorado: (1) . Integrantes: Vanessa Braganholo Murta - Integrante / Guilherme Horta Travassos - Integrante / Cláudia Werner - Integrante / Leonardo Gresta Paulino Murta - Integrante / Marta Lima de Queirós Mattoso - Coordenador. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro. Número de produções C, T A: 3 / Número de orientações: 1
Membro: Vanessa Braganholo Murta.
4.   2007-Atual. LAPP - Laboratório de Análise de Políticas Públicas - UNB
Descrição: O principal objetivo do Laboratório é apoiar as atividades do Grupo de Pesquisa em Instituições e Políticas Públicas (GIPP) relacionadas à realização de pesquisas aplicadas e desenvolvimento experimental vinculados aos processos de formação, gestão e avaliação de políticas públicas.. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Marcel de Moraes Pedroso - Coordenador.
Membro: Marcel de Moraes Pedroso.
5.   2007-2009. Proveniência de dados em experimentos científicos (CNPq, Edital Universal)
Descrição: O objetivo principal do projeto é o desenvolvimento de tecnologias facilitadoras para a gerência de proveniência de experimentos em larga escala. Pretende-se apoiar a gerência de experimentos científicos por meio da integração de um SGWfC (Sistema de Gerência de Workflow) com serviços de armazenamento de dados e de proveniência, de maneira a possibilitar a visualização dos dados de proveniência e dados intermediários gerados por um experimento, assim como realizar consultas analíticas sobre a massa de dados acumulada ao longo das diversas execuções de workflows efetuadas durante as pesquisas.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (1) . Integrantes: Vanessa Braganholo Murta - Integrante / Marta Lima de Queirós Mattoso - Coordenador. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro. Número de produções C, T A: 5
Membro: Vanessa Braganholo Murta.
6.   2007-2009. RecVisio - Visualização e Recuperação de Informação (CNPq, Edital Universal)
Descrição: Os objetivos principais deste projeto são investigar técnicas que melhorem os resultados da busca exploratória. Pretendemos investigas vários aspectos ligados à busca exploratória, incluindo descoberta automática de domínio, casamento automático de documentos contra ontologias e extração automática de ontologias.. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Graduação: (2) / Mestrado acadêmico: (4) . Integrantes: Vanessa Braganholo Murta - Coordenador / Maria Luiza Machado Campos - Integrante. Financiador(es): (CNPq) Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro. Número de produções C, T A: 3 / Número de orientações: 4
Membro: Vanessa Braganholo Murta.
7.   2007-2010. Semantic Technologies for Archaeological Resources
Descrição: STAR is a 3 year AHRC funded project, in collaboration with English Heritage and the Royal School of Library and Information Science Denmark, applying semantic and knowledge-based technologies to the digital archaeology domain. The project aims to develop new methods for linking digital archive databases, vocabularies and the associated grey literature, exploiting the potential of a high level, core ontology and natural language processing techniques.. Situação: Concluído; Natureza: Pesquisa. Integrantes: Renato Rocha Souza - Integrante / Ceri Binding - Integrante / Andreas Vlachidis - Integrante / Douglas Tudhope - Coordenador. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Bolsa. Número de produções C, T A: 3
Membro: Renato Rocha Souza.
8.   2007-2008. XMan - Gerenciamento de Dados XML Distribuídos (Auxílio Instalação FAPERJ)
Situação: Concluído; Natureza: Pesquisa. Integrantes: Vanessa Braganholo Murta - Coordenador. Financiador(es): Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do RJ - Auxílio financeiro.
Membro: Vanessa Braganholo Murta.

2006

1.   2006-2009. Scientific Model Management
Descrição: Managing Scientific Model data and Process. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) . Integrantes: Fabio Andre Machado Porto - Coordenador. Número de produções C, T A: 2 / Número de orientações: 2
Membro: Fabio Andre Machado Porto.

2004

1.   2004-2006. DIP - Data, Information, and Process Integration with Semantic Web Services
Descrição: Process Integration through semantic web services. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (4) Doutorado: (1) . Integrantes: Fabio Andre Machado Porto - Integrante / Vu, Le Hung - Integrante / Hauswirth, Manfred - Integrante / Aberer, Karl - Integrante / Stefano Spaccapietra - Coordenador. Financiador(es): Comissão Européia - Auxílio financeiro. Número de produções C, T A: 3 / Número de orientações: 4
Membro: Fabio Andre Machado Porto.
2.   2004-2006. Mineração de Dados em Citopatologia
Descrição: Acompanhar a aplicação, a evolução e os desvios do conhecimento de profissionais em seus ambientes de trabalho constitui-se em um dos grandes desafios na área de ensino. Como, em geral, não há, no mercado de trabalho, uma avaliação formal periódica que leve o profissional à reciclagem direcionada, o desenvolvimento de recursos que viabilizem tais processos de avaliação apresenta-se como uma perspectiva bastante útil e promissora. Considerando a relevância da correta utilização do conhecimento em atividades da Área Médica, este contexto, em particular, mostra-se como um exemplo com grande potencial para aplicação de processos de ensino continuado. Assim sendo, este projeto tem como objetivos desenvolver e avaliar um sistema de apoio à decisão que possa ser utilizado em um processo de ensino continuado na área de Citopatologia. O conhecimento incorporado a este sistema deverá ser obtido a partir de processos de descoberta de conhecimento em bases de dados históricas reais. Validação e formalização de conhecimento tácito junto a especialistas em Citopatologia deverão ser realizadas.. Situação: Desativado; Natureza: Pesquisa. Alunos envolvidos: Graduação: (4) / Especialização: (0) / Mestrado acadêmico: (0) / Mestrado profissional: (0) / Doutorado: (0) . Integrantes: Jorge de Abreu Soares - Integrante / Claudia Ferlin - Integrante / Ronaldo Ribeiro Goldschmidt - Coordenador / Ricardo Drummond Marsicano Ribeiro - Integrante / Frederico Jabulka - Integrante / Leonardo Cunha - Integrante. Financiador(es): Centro Universitário da Cidade - Bolsa.
Membro: Jorge de Abreu Soares.
3.   2004-2007. Um Ambiente Integrado para Mineração de Dados Assistida e Geração Automática de Sistemas Baseados em Conhecimento
Descrição: Os constantes avanços na área da Tecnologia da Informação têm viabilizado o armazenamento de grandes e múltiplas bases de dados. Como conseqüência, um crescente interesse pela análise e compreensão destes dados vem desencadeando inúmeras e mais sofisticadas aplicações na área de KDD Descoberta de Conhecimento em Bases de Dados. A fim de prover recursos computacionais adequados para atender a esta demanda, esforços em pesquisas na área de KDD vêm se tornando cada vez mais necessários. Não foi constatada pelos autores desse projeto a existência de ambientes de KDD disponibilizados para uso público que possuam ferramentas integradas voltadas não só à orientação e à realização do processo de KDD, mas também à geração automática de sistemas baseados no conhecimento abstraído a partir dos dados. Diante desse cenário, este projeto tem como objetivos pesquisar, formalizar, implementar e avaliar um ambiente de KDD que reúna as funcionalidades mencionadas. Para tanto, deverão ser utilizadas como base duas ferramentas cujo desenvolvimento vem sendo realizado em programas de iniciação científica (JavaBramining e JavaGenesys) e um ambiente inteligente de assistência à orientação do processo de KDD (máquina de IKDD), produto de uma tese de doutorado.. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Graduação: (5) / Especialização: (0) / Mestrado acadêmico: (0) / Mestrado profissional: (0) / Doutorado: (0) . Integrantes: Jorge de Abreu Soares - Integrante / Claudia Ferlin - Integrante / Ronaldo Ribeiro Goldschmidt - Coordenador / Emanuel Piseces Lopes Passos - Integrante / Rafael Castaneda Ribeiro - Integrante / Bruno Conde - Integrante / Jean Philippe François - Integrante / Diego Saraiva Monteiro - Integrante / Felipe Bahiana - Integrante. Financiador(es): Centro Universitário da Cidade - Bolsa. Número de produções C, T A: 4
Membro: Jorge de Abreu Soares.

2003

1.   2003-2006. CoDIMS / ComCiDis
Descrição: Pesquisa em middlewares para suporte a aplicações distribuídas de banco de dados no grid. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (2) Doutorado: (1) . Integrantes: Fabio Andre Machado Porto - Coordenador. Número de produções C, T A: 3 / Número de orientações: 3
Membro: Fabio Andre Machado Porto.
2.   2003-2005. DAAD Distributed Aplications and Data
Descrição: Projeto de Cooperação Capes/COFECUB entre Brasil e INRIA (França) para desenvolvimento de tecnologia de banco de dados distribuídos. Situação: Em andamento; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (1) . Integrantes: Fabio Andre Machado Porto - Integrante / Patrick Valduriez - Integrante / Marta Mattoso - Coordenador. Financiador(es): Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Auxílio financeiro / Institute National de Recherche en Informatique et Automation - Cooperação.
Membro: Fabio Andre Machado Porto.
3.   2003-2004. Engenharia de Algoritmos
Descrição: Desenvolvimento de algoritmos aplicados. Situação: Em andamento; Natureza: Pesquisa. Integrantes: Fabio Andre Machado Porto - Integrante / Eduardo Laber - Integrante / Rui L. Milidiú - Coordenador. Financiador(es): Conselho Nacional de Desenvolvimento Científico e Tecnológico - Auxílio financeiro. Número de produções C, T A: 3
Membro: Fabio Andre Machado Porto.
4.   2003-2005. ROSA - Repository for Objects with Semantic Access
Descrição: Learning Content Management Systems (LCMS) supports e-learning applications with storage and efficient access for e-learning objects (LO)s. ROSA is a LCMS built as a semantic layer on the top of an XML native DBMS, Tamino. Together, ROSA and Tamino, offer instructional designers a semantic view of e-learning content. In this paper, we present ROSA Data Model and Query Language, designed as an extension to RDF data model and RQL query language. The Data Model is structured around the LO modeling and their relationships, adapted to the e-learning domain. An algebra defines valid operations over LO data. Queries are formulated in ROSAQL that extends RQL with joins, graph navigation and recursion. Situação: Concluído; Natureza: Pesquisa. Alunos envolvidos: Mestrado acadêmico: (3) . Integrantes: Fabio Andre Machado Porto - Coordenador / Ana Maria Moura - Integrante / Abílio Fernandes - Integrante / Adriana Fernandeez - Integrante / Fábio José Coutinho da Silva - Integrante. Número de produções C, T A: 2 / Número de orientações: 3
Membro: Fabio Andre Machado Porto.


(*) Relatório criado com produções desde 2000 até 2018
Data de processamento: 26/04/2018 10:50:31