Abstract in English:
A large-scale sequencing of sugarcane expressed sequence tags (ESTs) was carried out as a first step in depicting the genome of this important tropical crop. Twenty-six unidirectional cDNA libraries were constructed from a variety of tissues sampled from thirteen different sugarcane cultivars. A total of 291,689 cDNA clones were sequenced in their 5’ and 3’end regions. After trimming low-quality sequences and removing vector and ribosomal RNA sequences, 237,954 ESTs potentially derived from protein-encoding messenger RNA (mRNA) remained. The average insert size in all libraries was estimated to be 1,250bp with the insert length varying from 500 to 5,000 bp. Clustering the 237,954 sugarcane ESTs resulted in 43,141clusters, from which 38% had no matches with existing sequences in the public databases. Around 53% of the clusters were formed by ESTs expressed in at least two libraries while 47% of the clusters are formed by ESTs expressed in only one library. A global analysis of the ESTs indicated that around 33% contain cDNA clones with full-length insert.Abstract in Portuguese:
O projeto SUCEST (Sugarcane EST Project) produziu 291.904 ESTs de cana-de-açúcar. Nesse projeto, o Laboratório de Bioinformática criou o web site que foi o "ponto de encontro" dos 74 laboratórios de sequenciamento e data mining que fizeram parte do consórcio para o projeto. O Laboratório de Bioinformática (LBI) recebeu, processou, analisou e disponibilizou ferramentas para a exploração dos dados. Neste artigo os dados, serviços e programas implementados pelo LBI para o projeto são descritos, incluindo o procedimento de clustering que gerou 43.141 clusters.Abstract in English:
The Sugarcane EST project (SUCEST) produced 291,904 expressed sequence tags (ESTs) in a consortium that involved 74 sequencing and data mining laboratories. We created a web site for this project that served as a ‘meeting point’ for receiving, processing, analyzing, and providing services to help explore the sequence data. In this paper we describe the information pathway that we implemented to support this project and a brief explanation of the clustering procedure, which resulted in 43,141 clusters.Abstract in Portuguese:
O método de clustering adotado no Projeto SUCEST (Sugarcane EST Project) tinha vários problemas (muitos clusters, presença de seqüências de ribossomo etc.) Nós assumimos a tarefa de reprojetar todo o processo de clustering, propondo uma "limpeza" inicial mais cuidadosa das seqüências. Neste artigo as estratégias de limpeza das seqüências e de clustering são descritas em detalhe, incluindo os números oficiais do projeto (237,954 ESTs e 43,141 clusters).Abstract in English:
The original clustering procedure adopted in the Sugarcane Expressed Sequence Tag project (SUCEST) had many problems, for instance too many clusters, the presence of ribosomal sequences, etc. We therefore redesigned the clustering procedure entirely, including a much more careful initial trimming of the reads. In this paper the new trimming and clustering strategies are described in detail and we give the new official figures for the project, 237,954 expressed sequence tags and 43,141 clusters.Abstract in Portuguese:
O sequenciamento de ESTs (etiquetas de sequencias transcritas) tem possibilitado a descoberta de muitos novos genes em uma ampla variedade de organismos. Um aumento do aproveitamento desta informação pela comunidade científica tem sido possível graças ao desenvolvimento de base de dados contendo seqüências completamente anotadas. O trabalho aqui relatado teve como objetivo a identificação de ESTs de cana de açúcar seqüenciadas através do projeto SUCEST (<A HREF="http://sucest.lad.ic.%20unicamp.br/">http://sucest.lad.ic. unicamp.br</A>) que codificam para proteínas envolvidas em mecanismos de transdução de sinal. Nós também preparamos um catálogo dos componentes de transdução de sinal da cana de açúcar (SUCAST) englobando as principais categorias e vias conhecidas (<A HREF="http://sucest.lad.ic.unicamp.%20br/private/mining-reports/QG/QG-mining.htm">http://sucest.lad.ic.unicamp. br/private/mining-reports/QG/QG-mining.htm</A>). ESTs codificadoras de enzimas envolvidas nas rotas de biossíntese de hormônios (giberelinas, etileno, auxinas, ácido abscíssico, ácido jasmônico) foram encontradas e sua expressão específica nos tecidos foi inferida a partir de seu enriquecimento nas diferentes bibliotecas. Quando possível, transmissores do sinal hormonal e da resposta a peptídeos produzidos pela planta foram associados a suas respectivas vias. Mais de 100 receptores foram encontrados na cana de açúcar, entre os quais uma grande família de receptores Ser/Thr quinase e também de fotoreceptores, receptores do tipo histidina quinase e seus respectivos reguladores da resposta. Proteínas G e GTPases pequenas foram também analisadas e comparadas com membros destas famílias já conhecidos em mamíferos e plantas. As vias principais que envolvem a participação de proteínas quinases e fosfatases foram mapeadas, em especial as vias da quinase MAP quinase e do inositol que são bem estudadas em plantas.Abstract in English:
EST sequencing has enabled the discovery of many new genes in a vast array of organisms, and the utility of this approach to the scientific community is greatly increased by the establishment of fully annotated databases. The present study aimed to identify sugarcane ESTs sequenced in the sugarcane expressed sequence tag (SUCEST) project (<A HREF="http://sucest.lad.ic.unicamp.br/">http://sucest.lad.ic.unicamp.br</A>) that corresponded to signal transduction components. We also produced a sugarcane signal transduction (SUCAST) catalogue (<A HREF="http://sucest.lad.ic.unicamp.br/private/mining-reports/QG/QG-mining.htm">http://sucest.lad.ic.unicamp.br/private/mining-reports/QG/QG-mining.htm</A>) that covered the main categories and pathways. Expressed sequence tags (ESTs) encoding enzymes for hormone (gibberellins, ethylene, auxins, abscisic acid and jasmonic acid) biosynthetic pathways were found and tissue specificity was inferred from their relative frequency of occurrence in the different libraries. Whenever possible, transducers of hormones and plant peptide signaling were catalogued to the respective pathway. Over 100 receptors were found in sugarcane, which contains a large family of Ser/Thr kinase receptors and also photoreceptors, histidine kinase receptors and their response regulators. G-protein and small GTPases were analyzed and compared to known members of these families found in mammalian and plant systems. Major kinase and phosphatase pathways were mapped, with special attention being given to the MAP kinase and the inositol pathway, both of which are well known in plants.Abstract in Portuguese:
Quinases de proteínas relacionadas a SNF1 (SnRK) podem desempenhar um papel importante na regulação da expressão gênica em células vegetais. Essa família de proteínas regulatórias é representada pela quinase de proteínas SNF1 (sucrose non-fermenting -1) em Saccharomyces cerevisiae, AMPKs (quinase de proteínas ativadas por AMP) em células de mamíferos e SnRKs (quinase de proteínas relacionadas a SNF1) em células vegetais. A família de SnRKs foi reorganizada em três subfamílias de acordo com suas relações filogenéticas com base nas seqüências de aminoácidos das proteínas. Membros das subfamílias de SnRKs foram identificados em diversas plantas. Existem evidências mostrando que essa família de proteínas está envolvida em resposta a estresses (nutricional e ambiental), apesar de seu papel não ser totalmente compreendido. Nesse trabalho nós identificamos 22 contíguos de ESTs (expressed sequence tags) de cana-de-açúcar codificando SnRKs putativas. O alinhamento das seqüências de aminoácidos das SnRKs putativas de cana-de-açúcar com seqüências de aminoácidos de SnRKs identificadas em outras plantas revelaram um domínio catalítico N-terminal altamente conservado. Além disso, nossos resultados indicaram que em cana-de-açúcar há pelo menos um membro de cada subfamília de SnRKs. Análise do padrão de expressão dos contíguos de EST codificando para SnRK putativas nas 26 bibliotecas selecionadas do banco de dados do Sucest, indicou que membros dessa família de quinases são expressos por toda planta. Membros de cada subfamília não apresentaram padrões de expressão específicos, sugerindo que suas funções não estão correlacionadas com sua relação filogenética, com base nas seqüências de aminoácidos da região N-terminal.Abstract in English:
Sucrose non-fermenting-1-related protein kinases (SnRKs) may play a major role in regulating gene expression in plant cells. This family of regulatory proteins is represented by sucrose non-fermenting-1 (SNF1) protein kinase in Saccharomyces cerevisiae, AMP-activated protein kinases (AMPKs) in mammals and SnRKs in higher plants. The SnRK family has been reorganized into three subfamilies according to the evolutionary relationships of their amino acid sequences. Members of the SnRK subfamily have been identified in several plants. There is evidence that they are involved in the nutritional and/or environmental stress response, although their roles are not yet well understood. We have identified at least 22 sugarcane expressed sequence tag (EST) contigs encoding putative SnRKs. The amino acid sequence alignment of both putative sugarcane SnRKs and known SnRKs revealed a highly conserved N-terminal catalytic domain. Our results indicated that sugarcane has at least one member of each SnRK subfamily. Expression pattern analysis of sugarcane EST-contigs encoding putative SnRKs in 26 selected cDNA libraries from the sugarcane expressed sequence tag SUCEST database has indicated that members of this family are expressed throughout the plant. Members of the same subfamily showed no specific expression patterns, suggesting that their functions are not related to their phylogenic relationships based on N-terminal amino acid sequence phylogenetic relationships.Abstract in Portuguese:
Seqüências completas de três cDNAs que codificam proteínas 14-3-3 de cana-de-açúcar (Saccharum officinarum) foram encontradas no projeto genoma EST de cana-de-açúcar. As proteínas codificadas por essas seqüências foram identificadas baseando-se no agrupamento de ESTs de cana-de-açúcar e, três "clusters" (SCCCLR1022 D05.g, SCCCRZ1001D02.g e SCBFLR1026E02.g) foram similares a proteínas 14-3-3 de outras monocotiledôneas. O cluster SCCCLR1022D05.g apresentou similaridade de 99% com a proteína 14-3-3 de milho (gi|1345587) e, os clusters SCCCRZ1001D02.g e SCBFLR1026E02.g foram similares a proteína 14-3-3 de arroz (gi|7435022), 96% e 94%, respectivamente. Embora proteínas 14-3-3 têm sido relatadas como sendo específicas a organismos, tecidos e órgãos, todos os "clusters" de cana-de-açúcar correspondentes a 14-3-3 foram provenientes de cDNAs advindos de diferentes tecidos.Abstract in English:
In a search of the sugarcane expressed sequence tag (SUCEST) database we located three full-length cDNAs (SCCCLR1022D05.g, SCCCRZ1001D02.g and SCBFLR1026E02.g) encoding the 14-3-3 proteins from sugarcane (Saccharum officinarum). The encoded proteins were identified based on the clustering of the expressed sequence tags and were shown to encode proteins similar to 14-3-3 proteins of other monocotyledonous plants. Cluster SCCCLR1022D05.g was 99% similar to the maize 14-3-3-like protein (gi|1345587) while cluster SCCCRZ1001D02.g shared 96% and SCBFLR1026E02.g 94% similarity with the 14-3-3 protein of rice (gi|7435022). Although 14-3-3 proteins have been reported to be specific to particular species, tissue or organ from which they were isolated, all three sugarcane clusters were found to be expressed in several tissues.Abstract in Portuguese:
A partir dos dados do projeto de sequenciamento de Ests da Cana de Açúcar (Sucest/FAPESP) e utilizando BLAST (tblastn) como ferramenta, foi realizada uma busca de genes homólogos aos elementos envolvidos nos processos de foto-recepção e já descritos para outras plantas, principalmente Arabidopsis. Foram obtidas altas identidades para os fitocromos A, B e C assim como para os criptocromos 1, 2 e a fototropina. Diversos elementos identificados como reguladores primários ou secundários na transdução de sinal de foto-receptores também foram identificados com baixos valores de E-value.Abstract in English:
A search in the sugarcane expressed sequence tag (SUCEST) database for homologues of plant genes involved in photo-sensory mechanisms was carried out using the basic local alignment tool (BLAST). Our results shown that known elements (phytochromes, cryptochromes and phototoprin) present in Arabidopsis and other higher plants were detected with low e-values. We also searched for proteins interacting with photoreceptors in primary or downstream signaling events. One putative homologue for a protein postulated to be a primary element in phytochrome signaling pathways was identified, as were other candidates for downstream interacting factors.Abstract in Portuguese:
Construímos um banco de referência não redundante de fatores de regulação da transcrição do tipo bZIP a partir de dados do genôma de Arabidopsis thaliana. Os fatores bZIP de Arabidopsis foram ordenados em treze famílias de proteínas evolutivamente relacionadas e essa classificação foi usada para organizar os cDNAs de cana de açúcar que codificam proteínas bZIP. Além disso, mostramos que essa classificação poderá ser útil para definir "Putative Clusters of Orthologous Groups" de reguladores bZIP de plantas superiores.Abstract in English:
We built a complete and non-redundant database of bZIP transcriptional regulatory factors from the Arabidopsis reference genome. These Arabidopsis bZIP factors were ordered into thirteen families of evolutionary related proteins and this classification was used to identify and organize sugarcane cDNAs encoding bZIP proteins. We also show how this classification should help in defining putative clusters of orthologous groups of higher plant bZIP regulators and briefly discuss the expected benefits of this procedure to efficiently characterize sugarcane bZIP transcriptional regulators.Abstract in Portuguese:
Resultados recentes da pesquisa sobre divisão celular em plantas sugerem que a maioria dos reguladores fundamentais do ciclo celular são conservados em relação aos outros organismos eucariotos, mas que os mecanismos de controle superimpostos à maquinária básica, e a sua integração com o crescimento e desenvolvimento são processos característicos das plantas. Até agora, a maioria dos estudos de divisão celular em plantas tem sido conduzido em dicotiledôneas. Entretanto, as plantas monocotiledôneas tem estratégias de desenvolvimento próprias, que irão afetar a regulação da divisão nos meristemas. Objetivando avançar o conhecimento de como a divisão celular é integrada com os mecanismos básicos que controlam a progressão do ciclo celular em monocotiledôneas, uma busca exaustiva por genes de cana de açúcar envolvidos em divisão celular foi feita no banco de dados do SUCEST (sugarcane EST project). Os resultados obtidos incluem a descrição de várias classes de quinases dependentes de ciclinas (CDKs), de ciclinas do tipo A, B, C, D, e H; de proteínas que interagem com CDK; de quinases que ativam e inibem a atividade de CDKs, de proteínas homólogas ao gene retinoblastoma, e de fatores de expressão da família E2F. Grande parte dos genes do ciclo celular de cana de açúcar parecem ser codificados por famílias multigênicas. Assim como em plantas dicotiledôneas a transcrição do CDK-a não é restrita a celulas em divisão, mas a grande maioria dos ESTs de CDK-b são encontrados em regiões de alta proliferação. A expressão dos genes que codificam CKI é bem mais forte em regiões de pouca divisão celular, notadamente em gemas laterais. Padrões de expressão compartilhados de grupos de genes foi revelado por "Northern blot" digital, sugerindo que uma abordagem semelhante pode ser usada para identificar genes que participam da mesma via regulatória.Abstract in English:
Data on cell cycle research in plants indicate that the majority of the fundamental regulators are conserved with other eukaryotes, but the controlling mechanisms imposed on them, and their integration into growth and development is unique to plants. To date, most studies on cell division have been conducted in dicot plants. However, monocot plants have distinct developmental strategies that will affect the regulation of cell division at the meristems. In order to advance our understanding how cell division is integrated with the basic mechanisms controlling cell growth and development in monocots, we took advantage of the sugarcane EST Project (Sucest) to carry an exhaustive data mining to identify components of the cell cycle machinery. Results obtained include the description of distinct classes of cyclin-dependent kinases (CDKs); A, B, D, and H-type cyclins; CDK-interacting proteins, CDK-inhibitory and activating kinases, pRB and E2F transcription factors. Most sugarcane cell cycle genes seem to be member of multigene families. Like in dicot plants, CDKa transcription is not restricted to tissues with elevated meristematic activity, but the vast majority of CDKb-related ESTs are found in regions of high proliferation rates. Expression of CKI genes is far more abundant in regions of less cell division, notably in lateral buds. Shared expression patterns for a group of clusters was unraveled by transcriptional profiling, and we suggest that similar approaches could be used to identify genes that are part of the same regulatory network.Abstract in Portuguese:
Como na maior parte das gramíneas, num determinado momento do seu ciclo de vida, o meristema vegetativo da cana-de-açúcar é convertido em meristema reprodutivo. Em cana-de-açúcar há pelo menos duas conversões meristemáticas distintas entre a indução para o florescimento e a formação do florete. Em espécies dicotiledôneas modelo, a conversão sucessiva das identidades dos meristemas, bem como o arranjo concêntrico de órgãos florais são controlados geneticamente. Todos os genes e/ou proteínas sabidamente envolvidos no desenvolvimento floral foram anotados e identificados no banco de dados do SUCEST (Sugarcane EST Project). Comparações de seqüências entre genes reconhecidamente envolvidos no controle do desenvolvimento floral revelaram a conservação evolutiva entre os mecanismos de formação do padrão de desenvolvimento floral entre mono- e dicotiledôneas, bem como entre as gramíneas. Nossos estudos se concentraram na análise das famílias multigênicas dos fatores de transcrição do tipo MADS-box e AP2, uma vez que estes têm um papel importante na regulação do desenvolvimento reprodutivo vegetal. Também são apresentadas considerações sobre a genética evolutiva do desenvolvimento das flores de gramíneas e sua relação com o modelo ABC do desenvolvimento floral.Abstract in English:
In sugarcane (Saccharum sp) as with other species of grass, at a certain moment of its life cycle the vegetative meristem is converted into an inflorescence meristem which has at least two distinct inflorescence branching steps before the spikelet meristem terminates in the production of a flower (floret). In model dicotyledonous species such successive conversions of meristem identities and the concentric arrangement of floral organs in specific whorls have both been shown to be genetically controlled. Using data from the Sugarcane Expressed Sequence Tag (EST) Project (SUCEST) database, we have identified all sugarcane proteins and genes putatively involved in reproductive meristem and flower development. Sequence comparisons of known flower-related genes have uncovered conserved evolutionary pathways of flower development and flower pattern formation between dicotyledons and monocotyledons, such as some grass species. We have paid special attention to the analysis of the MADS-box multigene family of transcription factors that together with the APETALA2 (AP2) family are the key elements of the transcriptional networks controlling plant reproductive development. Considerations on the evolutionary developmental genetics of grass flowers and their relation to the ABC homeotic gene activity model of flower development are also presented.Abstract in Portuguese:
Existem quase 260.000 clones independentes, seqüenciados a partir da extremidade 5’, no banco de dados do SUCEST (Sugarcane Expressed Sequence Tag), os quais foram obtidos a partir de 37 bibliotecas de cDNA preparadas de diferentes tecidos. Este grande número de etiquetas de sequências expressas (ESTs) fornece uma oportunidade, sem precedentes em plantas, de realizar um ‘digital differential screening’ em bibliotecas de cDNA selecionadas. Geralmente, a frequência de um determinado EST está correlacionada ao acúmulo de transcritos nos tecidos dos quais as bibliotecas de cDNA foram construídas, e desta forma, é possível comparar o transcriptoma completo de diferentes tecidos, usando uma análise computacional de um banco de dados de ESTs. Em nossa pesquisa, analisamos os ESTs de cana-de-açúcar de acordo com sua expressão tecidual e identificamos mais de 1.000 putativos genes específicos de flor. O fato de que usando esta técnica fomos capazes de identificar homológos em cana-de-açúcar, de vários genes previamente descritos como específicos de pólen, sustenta este método de estimar especificidade tecidual. Além disto, ESTs com similaridade a genes específicos de órgãos reprodutivos foram revelados, como por exemplo, o gene que codifica uma proteína meiótica essencial para a montagem do complexo sinaptonêmico e sinapse normal. Esta abordagem também permitiu a identificação de muitas sequências anônimas, específicas de flor, que são boas candidatas para novos genes envolvidos com a reprodução de plantas. Este trabalho descreve a análise dos níveis de expressão gênica de 24 clusters de ESTs, durante o desenvolvimento floral, usando um ‘northern blot digital’ construído a partir da contagem direta dos ESTs das bibliotecas não-normalizadas de cDNAs de cana-de-açúcar.Abstract in English:
There are almost 260,000 independent clones sequenced from the 5’ end in the Sugarcane Expressed Sequence Tag (SUCEST) database, which have been obtained from 37 cDNA libraries prepared from different tissues. This large number of expressed sequence tags (ESTs) provides an opportunity, unprecedented in plants, to perform ‘digital differential screening’ on selected cDNA libraries. In general, the frequency of a particular EST correlates with transcript accumulation in the tissues from which the cDNA libraries were constructed, so it is possible to compare the whole transcriptome from different tissues using computer-assisted analysis of an EST database. In our research we analyzed sugarcane ESTs according to tissue expression and identified more than 1,000 putative flower-specific genes. The fact that using this technique we were able to identify sugarcane homologues of several genes previously described as pollen-specific justifies this method of assessing tissue specificity. In addition, ESTs similar to genes specific to reproductive organs were detected e.g. a sugarcane gene encoding a meiotic protein essential for assembly of the synaptonemal complex and normal synapsis. This approach also allowed the identification of many flower-specific anonymous sequences that are good candidates for being novel genes involved in plant reproduction. This paper describes the analysis of the gene expression levels of 24 EST clusters during flower development using a ‘digital northern blot’ constructed from direct EST counts made on the non-normalized sugarcane cDNA libraries.Abstract in Portuguese:
Algumas proteínas ao serem sintetizadas necessitam do auxílio de chaperones moleculares para seu correto enovelamento. Chaperones também estão envolvidas na dissolução de agregados protéicos, fazendo com que seu estudo seja de relevância biotecnológica e médica. Portanto, a identificação de seqüências de chaperones moleculares é uma tarefa importante. Nós usamos ferramentas de bioinformática para procurar informações geradas pelo sugarcane EST Genome Project (SUCEST) a fim de identificar e anotar chaperones e proteínas relacionas ao estresse. As seqüências do SUCEST eram anotadas como pertencentes a uma categoria de proteínas se o E-value encontrado fosse menor que 1,0e-05. Nossas anotações mostram que 4.164 seqüências 5’ EST são homólogas a chaperones moleculares, aproximadamente 1,8% de todos os 5’ EST que foram seqüenciados pelo SUCEST. Deste total, cerca de 44% pertence à família Hsp70 e suas co-chaperones, 10% à família Hsp90 e 13% à peptidil cis, trans isomerase. Do resultado da anotação, nós predizemos a existência de 156 diferentes subclasses de genes relacionados a chaperones no genoma da cana-de-açúcar. Juntos, nossos resultados apontam que os genes que codificam para estas proteínas são diversos e abundantemente expressos, o que enfatiza sua importância biológica.Abstract in English:
Some newly synthesized proteins require the assistance of molecular chaperones for their correct folding. Chaperones are also involved in the dissolution of protein aggregates making their study significant for both biotechnology and medicine and the identification of chaperones and stress-related protein sequences in different organisms is an important task. We used bioinformatic tools to investigate the information generated by the Sugarcane Expressed Sequence Tag (SUCEST) genome project in order to identify and annotate molecular chaperones. We considered that the SUCEST sequences belonged to this category of proteins when their E-values were lower than 1.0e-05. Our annotation shows that 4,164 of the 5’ expressed sequence tag (EST) sequences were homologous to molecular chaperones, nearly 1.8% of all the 5’ ESTs sequenced during the SUCEST project. About 43% of the chaperones which we found were Hsp70 chaperones and its co-chaperones, 10% were Hsp90 chaperones and 13% were peptidyl-prolyl cis, trans isomerase. Based on the annotation results we predicted 156 different chaperone gene subclasses in the sugarcane genome. Taken together, our results indicate that genes which encode chaperones were diverse and abundantly expressed in sugarcane cells, which emphasizes their biological importance.Abstract in Portuguese:
A resposta ao estresse oxidativo não é bem conhecida em plantas como em bactérias, leveduras e humanos. Por exemplo, assume-se que óxido nítrico tem várias funções em plantas apesar do gene que codificaria para óxido nítrico sintetase nunca ter sido isolado. Este trabalho descreve os resultados de uma busca no banco de dados de seqüências expressas de cana de açúcar (SUCEST) de genes envolvidos na resposta ao estresse oxidativo. Eu não encontrei genes similares a óxido nítrico no banco de dados do SUCEST, mas uma via alternativa para a produção deste radical livre pode ser proposta. Eu também encontrei vários genes envolvidos na defesa antioxidante, como quelantes de metais, antioxidantes de baixo peso molecular, enzimas antioxidantes e sistemas de reparo. Ascorbato (vitamina C) é um importante antioxidante em plantas porque é encontrado em altas concentrações em células vegetais e porque é substrato de ascorbato peroxidase, uma enzima que eu encontrei em diferentes isoformas no banco de dados do SUCEST. Eu também encontrei várias enzimas envolvidas na biossíntese de antioxidantes de baixo peso molecular que podem ser alvos para manipulação genética. A obtenção de plantas modificadas geneticamente que sintetizariam vitaminas C e E em altos níveis poderiam melhorar o valor nutricional e a tolerância a estresses de cana de açúcar. Os diversos componentes do sistema de defesa antioxidante interagem entre si e as suas sínteses devem ser muito bem reguladas. Fatores de transcrição envolvidos na regulação da resposta ao estresse oxidativo de bactérias, leveduras e de humanos diferem consideravelmente entre si e quando foram utilizados para buscas no banco de dados do SUCEST, somente genes com similaridades fracas foram encontrados, sugerindo que estas proteínas não são muito conservadas. O envolvimento de espécies reativas de oxigênio e nitrogênio na defesa de plantas contra patógenos também é discutido neste trabalho.Abstract in English:
Oxidative stress response in plants is still poorly understood in comparison with the correspondent phenomenon in bacteria, yeast and mammals. For instance, nitric oxide is assumed to play various roles in plants although no nitric oxide synthase gene has yet been isolated. This research reports the results of a search of the sugarcane expressed sequence tag (SUCEST) database for homologous sequences involved in the oxidative stress response. I have not found any gene similar to nitric oxide synthase in the SUCEST database although an alternative pathway for nitric oxide synthesis was proposed. I have also found several genes involved in antioxidant defense, e.g. metal chelators, low molecular weight compounds, antioxidant enzymes and repair systems. Ascorbate (vitamin C) is a key antioxidant in plants because it reaches high concentrations in cells and is a substrate for ascorbate peroxidase, an enzyme that I found in different isoforms in the SUCEST database. I also found many enzymes involved in the biosynthesis of low molecular weight antioxidants, which may be potential targets for genetic manipulation. The engineering of plants for increased vitamin C and E production may lead to improvements in the nutritional value and stress tolerance of sugarcane. The components of the antioxidant defense system interact and their synthesis is probably closely regulated. Transcription factors involved in regulation of the oxidative stress response in bacteria, yeast and mammals differ considerably among themselves and when I used them to search the SUCEST database only genes with weak similarities were found, suggesting that these transcription regulators are not very conserved. The involvement of reactive oxygen species and antioxidants in plant defense against pathogens is also discussed.Abstract in Portuguese:
Os padrões de expressão de 277 contíguos de ESTs de cana-de-açúcar codificando proteínas possivelmente associadas ao sistema de defesa vegetal, e.g. quitinases, beta-1,3- glucanases, fenilalanina amonia liases, chalcona sintases, chalcona isomerases, isoflavona redutases, glicoproteínas ricas em hidroxiprolina, glicoproteínas ricas em prolina, peroxidases, catalases, superóxido dismutases, fatores de transcrição similares a WRKY e proteínas envolvidas no controle de morte celular, foram avaliados utilizando o banco de dados do SUCEST. Proteínas WRKY putativas de cana-de-açúcar foram comparadas e suas relações filogenéticas determinadas. Análises de agrupamento hierárquico foram utilizadas para a identificação de ESTs relacionadas à defesa vegetal com padrões de expressão similares em bibliotecas de cDNA representativas. Visando identificar ESTs relacionadas à defesa vegetal com expressão diferencial em tecidos de cana-de-açúcar infectados com Gluconacetobacter diazotrophicus ou Herbaspirillum rubrisubalbicans, 179 contíguos de ESTs possivelmente associados à defesa expressos em tecidos não-infectados (folhas e raízes) e/ou tecidos infectados foram selecionados e agrupados por similaridade de seus perfis de expressão. Alterações nos níveis de expressão de 124 contíguos de ESTs relacionados à defesa expressos em tecidos não-infectados foram avaliadas em tecidos infectados. Aproximadamente 42% desses contíguos de ESTs não apresentaram expressão em tecidos infectados, enquanto 15% e 3% apresentaram supressão de mais de duas vezes em tecidos infectados com G. diazotrophicus ou H. rubrisubalbicans, respectivamente. Aproximadamente 14 e 8% dos contíguos de ESTs avaliados apresentaram indução superior a duas vezes em tecidos infectados com G. diazotrophicus ou H. rubrisubalbicans, respectivamente. A expressão diferencial de agrupamentos de genes relacionados à defesa vegetal pode ser importante para o estabelecimento de interações compatíveis entre plantas e diazotróficos endofíticos. Os resultados sugerem que o agrupamento hierárquico pode ser utilizado em escala genômica para a identificação de genes possivelmente envolvidos no controle de interações planta-microrganismos.Abstract in English:
The expression patterns of 277 sugarcane expressed sequence tags (EST)-contigs encoding putative defense-related (DR) proteins were evaluated using the Sugarcane EST database. The DR proteins evaluated included chitinases, beta-1,3-glucanases, phenylalanine ammonia-lyases, chalcone synthases, chalcone isomerases, isoflavone reductases, hydroxyproline-rich glycoproteins, proline-rich glycoproteins, peroxidases, catalases, superoxide dismutases, WRKY-like transcription factors and proteins involved in cell death control. Putative sugarcane WRKY proteins were compared and their phylogenetic relationships determined. A hierarchical clustering approach was used to identify DR ESTs with similar expression profiles in representative cDNA libraries. To identify DR ESTs differentially expressed in sugarcane tissues infected with Gluconacetobacter diazotrophicus or Herbaspirillum rubrisubalbicans, 179 putative DR EST-contigs expressed in non-infected tissues (leaves and roots) and/or infected tissues were selected and arrayed by similarity of their expression profiles. Changes in the expression levels of 124 putative DR EST-contigs, expressed in non-infected tissues, were evaluated in infected tissues. Approximately 42% of these EST-contigs showed no expression in infected tissues, whereas 15% and 3% showed more than 2-fold suppression in tissues infected with G. diazotrophicus or H. rubrisubalbicans, respectively. Approximately 14 and 8% of the DR EST-contigs evaluated showed more than 2-fold induction in tissues infected with G. diazotrophicus or H. rubrisubalbicans, respectively. The differential expression of clusters of DR genes may be important in the establishment of a compatible interaction between sugarcane and diazotrophic endophytes. It is suggested that the hierarchical clustering approach can be used on a genome-wide scale to identify genes likely involved in controlling plant-microorganism interactions.Abstract in English:
Deciphering plant-insect interactions at the molecular level is one of the major topics of interest in contemporary plant biology research. In the last few years, various aspects of the plant response to insect damage have been investigated, including the characterization of direct and indirect responses, the regulation of gene expression resulting from insect attack and the signal transduction pathways. Such research has resulted in the proposal of new methods to enhance host resistance to insect pests, including the use of insecticidal genes that can be transferred by genetic engineering into target crops. By integrating the understanding of how plants react to insect damage with the techniques of molecular biology researchers should be able to increase the wide range of methods available for the control of insect pests. The sugarcane transcriptome project (SUCEST) has allowed the identification of several orthologues genes involved in the plant response to insect damage. In this paper we summarize several aspects of the complex interaction between plants and insects and describe the use of in silico analysis to provide information about gene expression in different sugarcane tissues in response to insect attack.Abstract in Portuguese:
Danos no DNA podem ser induzidos por um grande número de agentes físicos e químicos presentes no ambiente, como também por compostos produzidos pelo próprio metabolismo celular. Estes danos podem interferir com processos celulares como replicação e transcrição, levando a morte celular e/ou mutações. Os baixos níveis de mutação nas células são devidos à presença de vias enzimáticas, que reparam os danos no DNA. Diversos genes de reparo de DNA têm sido clonados e seus produtos caracterizados, principalmente em bactérias, leveduras e mamíferos. O interesse no estudo de mecanismos de reparo de DNA advém de seu envolvimento com a proteção da integridade da informação genética. A alta conservação observada para a maioria dos genes relacionados ao reparo de DNA, especialmente em eucariotos, aponta para sua importância para a manutenção da vida na terra. Em plantas, o conhecimento sobre os mecanismos de reparo de DNA é ainda reduzido. Os primeiros genes de reparo foram recentemente clonados e o mecanismo de ação de seus produtos está por ser caracterizado. Nosso objetivo neste trabalho de data mining foi identificar, no banco de dados gerados pelo projeto Genoma da Cana de Açúcar (Sugarcane Expressed Tag Project-SUCEST), genes relacionados ao reparo por excisão de bases (BER). Esta busca foi feita através do programa tblastn. Em cana de açúcar, foram identificados clusters homólogos para a maioria das proteínas BER analisadas e um alto grau de conservação foi observado. Os melhores resultados foram obtidos com proteínas BER de Arabidopsis thaliana. Para alguns homólogos BER de cana de açúcar, a presença de mais de uma forma de mRNA é possível, como definido pela ocorrência de mais de um cluster homólogo.Abstract in English:
DNA damage can be induced by a large number of physical and chemical agents from the environment as well as compounds produced by cellular metabolism. This type of damage can interfere with cellular processes such as replication and transcription, resulting in cell death and/or mutations. The low frequency of mutagenesis in cells is due to the presence of enzymatic pathways which repair damaged DNA. Several DNA repair genes (mainly from bacteria, yeasts and mammals) have been cloned and their products characterized. The high conservation, especially in eukaryotes, of the majority of genes related to DNA repair argues for their importance in the maintenance of life on earth. In plants, our understanding of DNA repair pathways is still very poor, the first plant repair genes having only been cloned in 1997 and the mechanisms of their products have not yet been characterized. The objective of our data mining work was to identify genes related to the base excision repair (BER) pathway, which are present in the database of the Sugarcane Expressed Sequence Tag (SUCEST) Project. This search was performed by tblastn program. We identified sugarcane clusters homologous to the majority of BER proteins used in the analysis and a high degree of conservation was observed. The best results were obtained with BER proteins from Arabidopsis thaliana. For some sugarcane BER genes, the presence of more than one form of mRNA is possible, as shown by the occurrence of more than one homologous EST cluster.Abstract in Portuguese:
A identificação e caracterização de genes envolvidos com reparo de DNA são de grande interesse, dada a sua importância na manutenção da integridade genômica. Além disso, a alta conservação dos genes de reparo de DNA faz com que possam ser utilizados como fonte de informação no que diz respeito à origem e evolução das espécies. Os mecanismos relacionados à remoção de danos pelo reparo de DNA, bem como suas conseqüências biológicas, já são bem conhecidas em bactérias, leveduras e animais. Entretanto, no que diz respeito a organismos vegetais, ainda há muito a ser investigado. No presente trabalho, apresentamos a identificação dos genes envolvidos nas principais vias de reparo de DNA em cana-de-açúcar, através de uma análise de similaridade do banco de dados do projeto brasileiro Sugarcane Expressed Sequence Tag (SUCEST) com seqüências protéicas conhecidas disponíveis em outros bancos de dados públicos (National Center of Biotechnology Information (NCBI) e Munich Information Center for Protein Sequences (MIPS) Arabidopsis thaliana). Esta busca revelou que a gama de proteínas envolvidas no reparo de DNA em cana-de-açúcar é similar a de outros eucariotos. Mesmo assim, foi possível identificar algumas características interessantes encontradas apenas em vegetais, provavelmente em função do seu processo evolutivo independente. As vias de reparo de DNA aqui representadas incluem fotorreativação, reparo excisão de bases, reparo excisão de nucleotídeos, reparo mismatch, end-joinning não homólogo, reparo por recombinação homóloga e tolerância a lesões. Este trabalho descreve as principais diferenças encontradas na maquinaria de reparo de DNA de células vegetais em relação àquela de organismos nos quais encontra-se bem descrita. Tais diferenças chamam a atenção para um potencial de mecanismos distintos em vegetais, que merecem futuras investigações.Abstract in English:
There is much interest in the identification and characterization of genes involved in DNA repair because of their importance in the maintenance of the genome integrity. The high level of conservation of DNA repair genes means that these genetic elements may be used in phylogenetic studies as a source of information on the genetic origin and evolution of species. The mechanisms by which damaged DNA is repaired are well understood in bacteria, yeast and mammals, but much remains to be learned as regards plants. We identified genes involved in DNA repair mechanisms in sugarcane using a similarity search of the Brazilian Sugarcane Expressed Sequence Tag (SUCEST) database against known sequences deposited in other public databases (National Center of Biotechnology Information (NCBI) database and the Munich Information Center for Protein Sequences (MIPS) Arabidopsis thaliana database). This search revealed that most of the various proteins involved in DNA repair in sugarcane are similar to those found in other eukaryotes. However, we also identified certain intriguing features found only in plants, probably due to the independent evolution of this kingdom. The DNA repair mechanisms investigated include photoreactivation, base excision repair, nucleotide excision repair, mismatch repair, non-homologous end joining, homologous recombination repair and DNA lesion tolerance. We report the main differences found in the DNA repair machinery in plant cells as compared to other organisms. These differences point to potentially different strategies plants employ to deal with DNA damage, that deserve further investigation.Abstract in Portuguese:
As vias de reparo de DNA são requeridas para manter a necessária estabilidade genômica e garantir a sobrevivência do organismo, frente aos efeitos deletérios causados por fatores endógenos e exógenos. Neste trabalho, realizamos a análise dos padrões de expressão dos genes de reparo de DNA encontrados na cana-de-açúcar, pela determinação da distribuição de ESTs nas diferentes bibliotecas de cDNA no projeto de transcriptoma SUCEST. Três vias de reparo - fotorreativação, reparo por excisão de bases e reparo por excisão de nucleotídeos - foram estudadas através do uso de proteínas de reparo como sondas para identificação de ESTs homólogos em cana-de-açúcar, com base na procura computacional de similaridade. Os resultados indicam que os genes de reparo de DNA possuem uma expressão diferencial nos tecidos, dependendo da via de reparo analisada. Esses dados in silico fornecem importantes indícios da expressão diferencial, a qual deve ser confirmada por análises bioquímicas diretas.Abstract in English:
DNA repair pathways are necessary to maintain the proper genomic stability and ensure the survival of the organism, protecting it against the damaging effects of endogenous and exogenous agents. In this work, we made an analysis of the expression patterns of DNA repair-related genes in sugarcane, by determining the EST (expressed sequence tags) distribution in the different cDNA libraries of the SUCEST transcriptome project. Three different pathways - photoreactivation, base excision repair and nucleotide excision repair - were investigated by employing known DNA repair proteins as probes to identify homologous ESTs in sugarcane, by means of computer similarity search. The results showed that DNA repair genes may have differential expressions in tissues, depending on the pathway studied. These in silico data provide important clues on the potential variation of gene expression, to be confirmed by direct biochemical analysis.Abstract in Portuguese:
O projeto de ESTs (Expressed sequence tag) da canade-açúcar (SUCEST) produziu um grande número de seqüências de cDNA de diferentes tecidos submetidos ou não a diferentes condições de estresse. Neste trabalho nós analisamos os resultados de uma busca, por Elementos de Transposição (TEs), que apresentou um grande numero de seqüências homólogas a TEs. Das 260.781 seqüências agrupadas em 81.223 clusters pelo programa Phrap (fragment assembly program), um total de 276 seqüências apresentaram homologia com TEs previamente descritos utilizando-se uma nota de corte estringente de 50 ou melhor. Clones homólogos aos grupos de retrotransposons com LTR (long terminal repeat) copia/Ty1 e Gypsy/ty3 foram achados porém nenhum retroelemento sem LTR foi identificado. A maioria das famílias de transposons estão representadas em cana-de-açucar incluindo Activator (Ac), Mutator (MuDR), Supressor-mutator (En/Spm) e Mariner. Para podermos comparar a diversidade dos TEs nos genoams das gramíneas, nós buscamos os TEs em espécies relacionadas a cana-de-açúcar tais como O sativa, Z. mays e S. bicolor. Nós também apresentamos os resultados preliminares do potencial uso de TEs como marcadores moleculares na identificação de cultivares.Abstract in English:
The sugarcane expressed sequence tag (SUCEST) project has produced a large number of cDNA sequences from several plant tissues submitted or not to different conditions of stress. In this paper we report the result of a search for transposable elements (TEs) revealing a surprising amount of expressed TEs homologues. Of the 260,781 sequences grouped in 81,223 fragment assembly program (Phrap) clusters, a total of 276 clones showed homology to previously reported TEs using a stringent cut-off value of e-50 or better. Homologous clones to Copia/Ty1 and Gypsy/Ty3 groups of long terminal repeat (LTR) retrotransposons were found but no non-LTR retroelements were identified. All major transposon families were represented in sugarcane including Activator (Ac), Mutator (MuDR), Suppressor-mutator (En/Spm) and Mariner. In order to compare the TE diversity in grasses genomes, we carried out a search for TEs described in sugarcane related species O.sativa, Z. mays and S. bicolor. We also present preliminary results showing the potential use of TEs insertion pattern polymorphism as molecular markers for cultivar identification.Abstract in English:
Expressed sequence tags (ESTs) in the sugarcane (Saccharum spp) database (SUCEST) were electronically searched and 402 microsatellites identified. Various dinucleotide and trinucleotide simple sequence repeat (SSR) motifs were found, with these being more frequently observed in ESTs obtained from flower cDNA libraries. PCR primers were designed for 20 of these SSRs and were tested on eight sugarcane genotypes, the sequences of these primers and a list of known sugarcane genes containing SSR motifs being presented in this paper. Polymorphisms were evident both at the cultivar level and between Saccharum species. These results show that EST-derived SSRs in Saccharum species are useful because they are polymorphic and transferable. The large number of microsatellites that will eventually be available from the SUCEST database (containing 295,000 submitted reads) will have many potential applications in linkage mapping and the planning of crosses.Abstract in Portuguese:
O presente estudo apresenta resultados preliminares demonstrando a utilização da base de dados de ESTs de cana-de-açúcar para detectar polimorfismo de base única (SNP para Single Nucleotide Polymorphism). Sessenta e quatro ESTs relacionados aos genes da 6-phosphogluconate deshydrogenases (Pgds) foram identificados e divididos em dois conjuntos bem delimitados, de 14 e 50 ESTs, correspondendo a dois genes, A e B. O alinhamento das seqüências do grupo A permitiu a detecção de um único SNP e o alinhamento das seqüências do grupo B permitiu a detecção de 39 SNP, incluindo 27 na região codificante do gene. Trinta e oito SNP foram bi-nucleotídicos e um único tri-nucleotídico. Nove inserções/supressões de um até 72 pares de base foram detectados nas regiões não-codificantes 3’ ou 5’. A robustez e as conseqüências dessas observações preliminares são discutidas.Abstract in English:
This paper presents preliminary results demonstrating the use of the sugarcane expressed sequence tag (EST) database (SUCEST) to detect single nucleotide polymorphisms (SNPs) inside 6-phosphogluconate dehydrogenase genes (Pgds). Sixty-four Pgd-related EST sequences were identified and partitioned into two clear-cut sets of 14 and 50 ESTs, probably corresponding to two genes, A and B, respectively. Alignment of A sequences allowed the detection of a single SNP while alignment of B sequences permitted the detection of 39 reliable SNPs, 27 of which in the coding sequence of the gene. Thirty-eight SNPs were binucleotidic and a single one was trinucleotidic. Nine insertions/deletions from one to 72 base pairs long were also detected in the noncoding 3’ and 5’ sequences. The soundness and the consequences of those preliminary observations on sequence polymorphism in sugarcane are discussed.Abstract in Portuguese:
Com o propósito de determinar a relação filogenética entre a cana-de-açúcar e membros da subtribo Saccharinae, a região gênica nuclear ITS1-5,8S-ITS2 (ITS: espaçador interno transcrito; 5,8S: DNA ribossomal 5.8S), com alta taxa evolutiva, foi identificada no banco de dados do projeto genoma "Sugarcane Expressed Sequence Tag" (SUCEST). Uma análise através do método de parcimônia, utilizando esta região e seqüências homólogas de 23 Andropogoneae retiradas da base de dados GenBank, indicou que a cana-de-açúcar é o grupo-irmão de Saccharum sinense. No entanto, devido à pequena quantidade de caracteres informativos para parcimônia e à homoplasia presentes na região ITS1-5,8S-ITS2, não foi possível determinar com segurança a relação filogenética entre a cana-de-açúcar e alguns dos demais membros da tribo Saccharine. Como alternativa para esta baixa resolução, dezessete regiões gênicas nucleares, cloroplasmáticas ou mitocondriais foram selecionadas a partir do banco de dados SUCEST com o objetivo de encontrar marcadores mais apropriados para a reconstrução da filogenia da cana-de-açúcar. Entre elas, aquelas correspondentes à alfa-tubulina, rpl16, e rpoC2 apresentaram baixa incidência de polimorfismo e taxas de evolução equivalentes ou mesmo maiores do que a observada para a região ITS1-5,8S-ITS2. Estes marcadores são propostos como preferenciais para estudos filogenéticos da subtribo Saccharinae.Abstract in English:
To determine the phylogenetic relationship between sugarcane cultivars and other members of the Saccharinae subtribe, we identified the fast evolving ITS1-5.8S-ITS2 (ITS = internal transcribed spacer; 5.8S = 5.8S ribosomal DNA) region of the sugarcane genome in the Sugarcane Expressed Sequence Tag (SUCEST) genome project database. Parsimony analysis utilizing this region and homologs belonging to the 23 closely related Andropogoneae currently deposited in the GenBank database has shown sugarcane as the sister group of Saccharum sinense. However, because there are few parsimony-informative characters and high homoplasy in the ITS1-5.8S-ITS2 region we were not able to determine with confidence the phylogenetic relationship between sugarcane and some of the remaining members of Saccharine subtribe. To find alternatives for the phylogenetic reconstruction of sugarcane evolutionary history, we selected 17 markers (nuclear, chloroplastic or mitochondrial) from the SUCEST database of which apha-tubulin, ribosomal protein L16 (rpl16) and DNA-directed RNA polymerase beta chain (rpoC2) were found to have a low incidence of polymorphism and comparable, or even faster, rates of evolution than the ITS1-5.8S-ITS2 region. We suggest that these markers should be considered as preferential choices for phylogenetic studies of Saccharinae subtribe.Abstract in Portuguese:
A mitocôndria funciona como uma usina geradora metabólica por meio da fosforilação oxidativa e tem sido alvo de um renovado interesse devido aos progressos no entendimento de sua biogênese e na descrição de novos papéis ligados à senescência, morte celular e montagem dos centros Fe/S. Uma análise global dos genes de planta ligados à esta organela é agora possível. A base de dados do projeto SUCEST foi examinada para detecção de ESTs com similaridade a genes nucleares relacionados às funções mitocondriais usando-se proteínas de Saccharomyces cerevisiae, Homo sapiens e Arabidopsis thaliana. Foram utilizadas 869 seqüências de proteínas para varrer o banco de ESTs do projeto SUCEST por meio do programa de busca de similaridade TBLASTN, sendo examinados 81.223 agrupamentos. Encontramos 367 agrupamentos com E-value <= 10-10 que representam os prováveis ortólogos em cana-de-açúcar dos genes correspondentes humanos, de levedura e de Arabidopsis. Encontramos produtos gênicos relacionados a todas as categorias funcionais ligados à atividade mitocondrial de maneira que este estudo serve de ponto de partida para a identificação dos genes de cana-de-açúcar envolvidos na biogênese e função da organela e para o estudo da estrutura e fisiologia destes genes.Abstract in English:
Mitochondria function as metabolic powerhouses by generating energy through oxidative phosphorylation and have become the focus of renewed interest due to progress in understanding the subtleties of their biogenesis and the discovery of the important roles which these organelles play in senescence, cell death and the assembly of iron-sulfur (Fe/S) centers. Using proteins from the yeast Saccharomyces cerevisiae, Homo sapiens and Arabidopsis thaliana we searched the sugarcane expressed sequence tag (SUCEST) database for the presence of expressed sequence tags (ESTs) with similarity to nuclear genes related to mitochondrial functions. Starting with 869 protein sequences, we searched for sugarcane EST counterparts to these proteins using the basic local alignment search tool TBLASTN similarity searching program run against 260,781 sugarcane ESTs contained in 81,223 clusters. We were able to recover 367 clusters likely to represent sugarcane orthologues of the corresponding genes from S. cerevisiae, H. sapiens and A. thaliana with E-value <= 10-10. Gene products belonging to all functional categories related to mitochondrial functions were found and this allowed us to produce an overview of the nuclear genes required for sugarcane mitochondrial biogenesis and function as well as providing a starting point for detailed analysis of sugarcane gene structure and physiology.Abstract in English:
A phylogenetic analysis of plant FtsH-like proteins was performed using protein sequences from the GENEBANK database and five groups of plant FtsH-like proteins were identified by neighbor-joining analysis. Prediction of the subcellular location of the proteins suggested that two (FtsH-m1 & FtsH-m2) were mitochondrial and three (FtsH-p1, FtsH-p2, FtsH-p3) were plastid targeting. The phylogenetic profile of plant FtsH-like proteins was used to search sugarcane expressed sequence tag (EST) clusters in the SUCEST database. Initially, 153 clusters presenting homology with FtsH-like proteins were recovered, of which 23 were confirmed by a BLAST search in the GENEBANK database and by comparison of their hidropathy index with that of previously described FtsH-like proteins. Sugarcane presented EST clusters in all phylogenetic groups. In silico expression analysis showed that the groups are differentially expressed in sugarcane tissues, with FtsH-p2 and FtsH-m1 presenting increased levels of expression.Abstract in Portuguese:
A busca por genes relacionados ao metabolismo da parede celular no banco de dados SUCEST-FAPESP resultou em 459 potenciais genes ("clusters") que correspondem a 3283 clones ("reads"), o que corresponde a cerca de 1.1% do número total de clones. Foram construídos mapas de superfície para correlacionar os genes com as bibliotecas dos diferentes tecidos. Foram encontradas correlações positivas ou neutras entre os genes em uma mesma biblioteca. Os genes relacionados à síntese de celulose (família CesA) foram os de maior expressão na planta, embora a maior expressão esteja associada à raiz e colmo. Entre as hidrolases, beta-1,3-glucanases, xiloglucano endo-beta-transglicosilase, beta-glucosidase e endo-beta-mananase foram os genes com o maior número de clones. Análise de correlação (por mapas de superfície) revelou que a expressão dos genes relacionados à biossíntese parece estar associada à hidrólise de hemicelulose, enquanto as hidrolases de pectina estão relacionadas principalmente às hidrolases de xiloglucano. O padrão de expressão de genes relacionados à parede celular, baseado no número de "reads" por "cluster" refletiu bem as características fisiológicas esperadas para cada tecido. Este é o primeiro trabalho que fornece uma visão geral do metabolismo de parede celular através da expressão dos genes em vários tecidos ao mesmo tempo. Por exemplo, inflorescências em desenvolvimento se comportaram de forma semelhante a tecidos meristemáticos e à região de transição folha-raiz. Estes dados servirão tanto para pesquisas em fisiologia e desenvolvimento de cana, como também para o desenvolvimento de processos industriais.Abstract in English:
Our search for genes related to cell wall metabolism in the sugarcane expressed sequence tag (SUCEST) database (<A HREF="http://sucest.lbi.dcc.unicamp.br/">http://sucest.lbi.dcc.unicamp.br</A>) resulted in 3,283 reads (1% of the total reads) which were grouped into 459 clusters (potential genes) with an average of 7.1 reads per cluster. To more clearly display our correlation coefficients, we constructed surface maps which we used to investigate the relationship between cell wall genes and the sugarcane tissues libraries from which they came. The only significant correlations that we found between cell wall genes and/or their expression within particular libraries were neutral or synergetic. Genes related to cellulose biosynthesis were from the CesA family, and were found to be the most abundant cell wall related genes in the SUCEST database. We found that the highest number of CesA reads came from the root and stem libraries. The genes with the greatest number of reads were those involved in cell wall hydrolases (e.g. beta-1,3-glucanases, xyloglucan endo-beta-transglycosylase, beta-glucosidase and endo-beta-mannanase). Correlation analyses by surface mapping revealed that the expression of genes related to biosynthesis seems to be associated with the hydrolysis of hemicelluloses, pectin hydrolases being mainly associated with xyloglucan hydrolases. The patterns of cell wall related gene expression in sugarcane based on the number of reads per cluster reflected quite well the expected physiological characteristics of the tissues. This is the first work to provide a general view on plant cell wall metabolism through the expression of related genes in almost all the tissues of a plant at the same time. For example, developing flowers behaved similarly to both meristematic tissues and leaf-root transition zone tissues. Besides providing a basis for future research on the mechanisms of plant development which involve the cell wall, our findings will provide valuable tools for plant engineering in the near future.Abstract in Portuguese:
Diversos genótipos brasileiros de cana-de-açúcar são capazes de crescer com baixa adição de adubos nitrogenados, obtendo elevadas contribuições da Fixação Biológica de Nitrogênio (FBN). Um tipo especial de associação com bactérias fixadoras de nitrogênio foi descrito em cana-de-açúcar, onde as bactérias endofíticas, como Gluconacetobacter diazotrophicus e Herbaspirillum spp., colonizam o interior dos tecidos vegetais, sem causar sintomas de doença. Com o objetivo de tentar entender o papel da cana-de-açúcar nesse tipo de associação, nós investigamos os perfis de expressão gênica de plantas colonizadas pelos diazotróficos endofíticos, usando o banco de dados do SUCEST. Um catálogo com os genes de cana-de-açúcar que são candidatos a se expressar exclusivamente ou preferencialmente durante a associação foi gerado. Esses dados preliminares sugerem que a cana-de-açúcar deve ter uma participação ativa na interação, respondendo a diversos processos metabólicos durante a associação.Abstract in English:
Several Brazilian sugarcane varieties have the ability to grow with little addition of inorganic nitrogen fertilizers, showing high contributions of Biological Nitrogen Fixation (BNF). A particular type of nitrogen-fixing association has been described in this crop, where endophytic diazotrophs such as Gluconacetobacter diazotrophicus and Herbaspirillum spp. colonize plant tissues without causing disease symptoms. In order to gain insight into the role played by the sugarcane in the interaction between this plant and endophytic diazotrophs, we investigated gene expression profiles of sugarcane plants colonized by G. diazotrophicus and H. rubrisubalbicans by searching the sugarcane expressed sequence tag SUCEST Database (<A HREF="http://sucest.lad.ic.unicamp.br/en/">http://sucest.lad.ic.unicamp.br/en/</A>). We produced an inventory of sugarcane genes, candidates for exclusive or preferential expression during the nitrogen-fixing association. This data suggests that the host plant might be actively involved in the establishment of the interaction with G. diazotrophicus and H. rubrisubalbicans.Abstract in Portuguese:
A absorção de nutrientes pelas plantas é um processo ativo, requerendo energia para o acúmulo de nutrientes essenciais em níveis mais elevados nos tecidos vegetais do que na solução do solo, enquanto que a presença de metais tóxicos ou excesso de nutrientes requererem mecanismos para modular o acúmulo de íons. Genes que codificam transportadores de íons, isolados de plantas e de leveduras, foram usados para identificar homólogos presumíveis no banco de dados de seqüências expressas de cana-de-açúcar (SUCEST). Cinco consensos de grupos de seqüências com homologia a genes de transportadores de fosfato de alta afinidade foram identificados. O consenso de um dos grupos permitiu a predição da proteína completa, com 541 amino ácidos e 81% de identidade com o gene NtPT1 de Nicotiana tabacum, consistindo de 12 domínios transmembrana divididos por uma grande região hidrofílica. Homólogos presumíveis a genes transportadores de micronutrientes de Arabidopsis thaliana também foram detectados em algumas bibliotecas do SUCEST. A absorção de ferro em gramíneas envolve a liberação de um composto fito-sideróforo, ácido mugenêico (MA), que complexa com Fe3+, sendo então absorvido por um transportador específico. Seqüências expressas (EST, expressed sequence tag) de cana-de-açúcar homólogas aos genes que codificam as três enzimas da via de biossíntese do ácido mugenêico (nicotianamina sintase; nicotianamina transferase; e a sintetase presumível do ácido mugenêico ids3), além de um transportador presumível de Fe3+-fito-sideróforo foram também detectados. Sete grupos de seqüências de cana-de-açúcar foram identificados com grande homologia com os membros da família de genes ZIP (ZIP1, ZIP3, ZIP4, IRT1 e ZNT1), enquanto que quatro grupos apresentaram homologia com ZIP2 e três com ZAT. Seqüências homólogas aos membros de uma outra família de genes, Nramp, que codificam transportadores de metais de ampla espectro, foram também detectados com expressão constitutiva. Transcritos parciais homólogos aos genes que codificam g-glutamilcisteína sintetase, glutationa sintetase e fitoquelatina sintase (responsáveis pela biossíntese da proteína quelante de metais, fitoquelatina) e todos os quatro tipos do outro principal peptídeo quelante de metais em plantas, metalotioneína (MT), foram identificados: MT do tipo I sendo a mais abundante (> 1% das seqüências na biblioteca de sementes), seguido pela MT do tipo II, com padrão de expressão similar àquele descrito para MT de Arabidopsis. A identificação e a compreensão da expressão de genes associados com a absorção de nutrientes e tolerância a metais poderiam possibilitar o desenvolvimento de variedades de cana-de-açúcar mais eficientes nutricionalmente, ou permitiriam o uso da cana-de-açúcar como planta hiper-acumuladora para a restauração de área contaminadas em programas de fitorremediação.Abstract in English:
Plant nutrient uptake is an active process, requiring energy to accumulate essential elements at higher levels in plant tissues than in the soil solution, while the presence of toxic metals or excess of nutrients requires mechanisms to modulate the accumulation of ions. Genes encoding ion transporters isolated from plants and yeast were used to identify sugarcane putative homologues in the sugarcane expressed sequence tag (SUCEST) database. Five cluster consensi with sequence homology to plant high-affinity phosphate transporter genes were identified. One cluster consensus allowed the prediction of a full-length protein containing 541 amino acids, with 81% amino acid identity to the Nicotiana tabacum NtPT1 gene, consisting of 12 membrane-spanning domains divided by a large hydrophilic charged region. Putative homologues to Arabidopsis thaliana micronutrient transporter genes were also detected in some of the SUCEST libraries. Iron uptake in grasses involves the release of the phytosiderophore mugeneic acid (MA) which chelate Fe3+ which is then absorbed by a specific transporter. Sugarcane expressed sequence tag (EST) homologous to genes coding for three enzymes of the mugeneic acid biosynthetic pathway [nicotianamine synthase; nicotianamine transferase; and putative mugeneic acid synthetase (ids3)] and a putative Fe3+-phytosiderophore transporter were detected. Seven sugarcane sequence clusters were identified with strong homology to members of the ZIP gene family (ZIP1, ZIP3, ZIP4, IRT1 and ZNT1), while four clusters homologous to ZIP2 and three to ZAT were found. Homologues to members of another gene family, Nramp, which code for broad-specificity transition metal transporters were also detected with constitutive expression. Partial transcripts homologous to genes encoding gamma-glutamylcysteine synthetase, glutathione synthetase, and phytochelatin synthase (responsible for biosynthesis of the metal chelator phytochelatin) and all four types of the major plant metal-chelator peptide metallothionein (MT) were identified: Type I MT being the most abundant (>1% of seed-library reads), followed by Type II which had a similar pattern of expression as that described for Arabidopsis MT. Identifying and understanding the expression of genes associated with nutrient uptake and metal tolerance could lead to the development of more nutrient-efficient sugarcane cultivars, or might allow the use of sugarcane as a hyper-accumulator plant for the restoration of contaminated areas in phytoremediation programs.Abstract in Portuguese:
Alumínio (Al) é um dos principais fatores que afetam o desenvolvimento de plantas em solos ácidos, reduzindo substancialmente a produtividade agrícola. Na América do Sul, cerca de 66% da superfície do solo apresenta acidez, onde a alta saturação de alumínio é uma das maiores limitações à prática agrícola. Apesar do crescente número de estudos, uma compreensão completa das bases bioquímicas e moleculares da tolerância ao alumínio em plantas está longe de ser alcançada. No caso da cana-de-açúcar, não há nada publicado sobre a regulação gênica induzida durante o stress por alumínio. O objetivo deste trabalho foi identificar genes de cana-de-açúcar relacionados com as várias vias metabólicas reconhecidamente envolvidas na resposta à toxidez do alumínio em outras espécies de plantas e leveduras. Para a maioria dos genes relacionados com alumínio em outras espécies foram identificados similares em cana-de-açúcar, tais como aqueles que codificam enzimas que combatem o stress oxidativo ou a infestação por patógenos, proteínas responsáveis pela exudação de ácidos orgânicos e pela transdução de sinais. O papel desses genes na tolerância ao alumínio é revisado. Devido ao alto grau de conservação do genoma entre espécies próximas de gramíneas como milho, cevada, sorgo e cana-de-açúcar, esses genes serão uma ferramenta valiosa para a melhor compreensão e manipulação da tolerância ao alumínio nestas espécies.Abstract in English:
Aluminum is one of the major factors that affect plant development in acid soils, causing a substantial reduction in yield in many crops. In South America, about 66% of the land surface is made up of acid soils where high aluminum saturation is one of the main limiting factors for agriculture. The biochemical and molecular basis of aluminum tolerance in plants is far from being completely understood despite a growing number of studies, and in the specific case of sugarcane there are virtually no reports on the effects of gene regulation on aluminum stress. The objective of the work presented in this paper was to prospect the sugarcane expressed sequence tag (SUCEST) data bank for sugarcane genes related to several biochemical pathways known to be involved in the responses to aluminum toxicity in other plant species and yeast. Sugarcane genes similar to most of these genes were found, including those coding for enzymes that alleviate oxidative stress or combat infection by pathogens and those which code for proteins responsible for the release of organic acids and signal transducers. The role of these genes in aluminum tolerance mechanisms is reviewed. Due to the high level of genomic conservation in related grasses such as maize, barley, sorghum and sugarcane, these genes may be valuable tools which will help us to better understand and to manipulate aluminum tolerance in these species.Abstract in Portuguese:
A N-glicosilação é uma das principais modificações pós-traducionais, sendo responsável por alterações na conformação, estabilidade e conseqüentemente na funcionalidade de proteínas em eucariotos. Com a finalidade de melhor compreender a via de N-glicosilação em plantas foi realizada uma prospecção no banco de seqüências expressas do projeto genoma da cana de açúcar (SUCEST). Foram identificadas noventa seqüências cujos produtos gênicos apresentam alto grau de similaridade com enzimas envolvidas na biossíntese e processamento de N-glicanos. Dos vinte e três genes da via de N-glicosilação previamente descritos em diferentes espécies, vinte e um foram detectados em cana de açúcar.Abstract in English:
The N-linked glycosylation of secretory and membrane proteins is the most complex posttranslational modification known to occur in eukaryotic cells. It has been shown to play critical roles in modulating protein function. Although this important biological process has been extensively studied in mammals, much less is known about this biosynthetic pathway in plants. The enzymes involved in plant N-glycan biosynthesis and processing are still not well defined and the mechanism of their genetic regulation is almost completely unknown. In this paper we describe our first attempt to understand the N-linked glycosylation mechanism in a plant species by using the data generated by the Sugarcane Expressed Sequence Tag (SUCEST) project. The SUCEST database was mined for sugarcane gene products potentially involved in the N-glycosylation pathway. This approach has led to the identification and functional assignment of 90 expressed sequence tag (EST) clusters sharing significant sequence similarity with the enzymes involved in N-glycan biosynthesis and processing. The ESTs identified were also analyzed to establish their relative abundance.Abstract in Portuguese:
Ligninas são compostos fenólicos encontrados nas paredes secundárias do sistema vascular vegetal e desempenham importantes papéis biológicos, reduzindo a permeabilidade da parede celular em relação à água, estando também envolvidas em mecanismos de defesa contra patógenos. A via metabólica da lignina e as enzimas envolvidas na sua síntese vem sendo caracterizadas nos últimos anos. Uma série de genes que codificam diferentes enzimas envolvidas na biossíntese da lignina foram identificados em diferentes espécies de plantas. A biossíntese de lignina está acoplada ao metabolismo dos fenilpropanóides, apresentando enzimas compartilhadas com outros processos metabólicos tais como fenilalanina amônio liase (PAL), cinnamato 4-hidroxilase (C4H) and ácido caféico O-metiltransferase (COMT) assim como enzimas específicas como cinamoil-CoA redutase (CCR) e cinamil álcool dehidrogenase (CAD). Em certos tipos de mutantes de milho e sorgo, um aumento na digestibilidade foi associado a uma redução no teor de lignina. Uma redução na atividade de CAD e COMT, importantes enzimas envolvidas na biossíntese de lignina vem sendo demonstrada. Estas observações tem motivado diferentes grupos de pesquisa a alterarem o conteúdo ou a composição da lignina em plantas modelo, assim como culturas de interesse econômico, através de engenharia genética. O principal objetivo prático destes projetos é uma otimização da utilização destas plantas levando a uma maior produção de papel e digestibilidade da ração animal. No presente trabalho foi realizado um inventário das seqüências de ESTs, que codificam enzimas envolvidas no metabolismo de lignina, presentes no Projeto Genoma de Cana-de-açúcar (SUCEST). A análise foi realizada com as enzimas chaves ferulato-5-hidroxilase (F5H), ácido caféico O-metiltransferase (COMT), cafeoil CoA O-metiltransferase (CCoAOMT), hidroxicinamato CoA ligase (4CL), cinamoil-CoA redutase (CCR) and cinamil álcool dehidrogenase (CAD). A análise comparativa destes genes com os descritos em outras espécies poderá servir para a identificação de marcadores moleculares em programas de melhoramento genético, assim como em projetos que visem a manipulação do metabolismo de lignina em cana-de-açúcar.Abstract in English:
Lignins are phenolic polymers found in the secondary wall of plant conductive systems where they play an important role by reducing the permeability of the cell wall to water. Lignins are also responsible for the rigidity of the cell wall and are involved in mechanisms of resistance to pathogens. The metabolic routes and enzymes involved in synthesis of lignins have been largely characterized and representative genes that encode enzymes involved in these processes have been cloned from several plant species. The synthesis of lignins is liked to the general metabolism of the phenylpropanoids in plants, having enzymes (e.g. phenylalanine ammonia-lyase (PAL), cinnamate 4-hydroxylase (C4H) and caffeic acid O-methyltransferase (COMT)) common to other processes as well as specific enzymes such as cinnamoyl-CoA reductase (CCR) and cinnamyl alcohol dehydrogenase (CAD). Some maize and sorghum mutants, shown to have defective in CAD and/or COMT activity, are easier to digest because they have a reduced lignin content, something which has motivated different research groups to alter the lignin content and composition of model plants by genetic engineering try to improve, for example, the efficiency of paper pulping and digestibility. In the work reported in this paper, we have made an inventory of the sugarcane expressed sequence tag (EST) coding for enzymes involved in lignin metabolism which are present in the sugarcane EST genome project (SUCEST) database. Our analysis focused on the key enzymes ferulate-5-hydroxylase (F5H), caffeic acid O-methyltransferase (COMT), caffeoyl CoA O-methyltransferase (CCoAOMT), hydroxycinnamate CoA ligase (4CL), cinnamoyl-CoA reductase (CCR) and cinnamyl alcohol dehydrogenase (CAD). The comparative analysis of these genes with those described in other species could be used as molecular markers for breeding as well as for the manipulation of lignin metabolism in sugarcane.Abstract in Portuguese:
Este trabalho foi realizado com os objetivos de gerar uma coleção de genes relacionados ao metabolismo secundário da cana de açúcar e investigar o padrão de expressão gênica de enzimas chaves reguladoras das principais vias biossintéticas ativas nos diferentes tipos de tecidos e situações de estresse físico-químico e biológico a que estão submetidas plantas cultivadas em casas de vegetação, campo ou in vitro. A estratégia de mineração dos dados da database de sequências expressas de cana de açúcar, SUCEST, usando ferramentas de bioinformática, focalizou classes de compostos como isoprenóides e fenilpropanóides que comprovadamente desempenham um papel na resposta de plantas a variações ambientais. Foram identificados e caracterizados genes que codificam enzimas chaves para a síntese de terpenóides, como a sesquiterpeno ciclase (SC); (CHS) para síntese de flavonóides; isoflavona sintase (IFS) envolvida na biossíntese de isoflavonóides que desempenharm importante papel na defesa de plantas e nodulação de raízes; isoflavona redutases (IFR) enzimas chaves para a síntese de fenilpropanóide fitoalexinas, bem como enzimas relacionadas à síntese de precursores de lignina, como a enzima ácido caféico- O- metiltransferase. O efeito do estresse causado por bactérias como Herbaspirillum rubri e Gluconacetobacter diazotroficans também foi avaliado tendo sido constatada a indução da expressão de chalcona sintase (CHS) em plântulas infectadas com esses agentes, sugerindo a ativação da via de flavonóides em resposta a este estresse biológico. Esses resultados apontam para o fato de que as vias do metabolismo de isopropanóides e de fenilpropanóides em cana de açúcar são ativadas de acordo com o estágio de desenvolvimento, especificidade de tecidos e em resposta a situações de estresse. Essas observações deverão ser confirmadas por meio de experimentação genética e bioquímica.Abstract in English:
A set of genes related to secondary metabolism was extracted from the sugarcane expressed sequence tag (SUCEST) database and was used to investigate both the gene expression pattern of key enzymes regulating the main biosynthetic secondary metabolism pathways and the major classes of metabolites involved in the response of sugarcane to environmental and developmental cues. The SUCEST database was constructed with tissues in different physiological conditions which had been collected under varied situation of environmental stress. This database allows researchers to identify and characterize the expressed genes of a wide range of putative enzymes able to catalyze steps in the phenylpropanoid, isoprenoid and other pathways of the special metabolic mechanisms involved in the response of sugarcane to environmental changes. Our results show that sugarcane cDNAs encoded putative ultra-violet induced sesquiterpene cyclases (SC); chalcone synthase (CHS), the first enzyme in the pathway branch for flavonoid biosynthesis; isoflavone synthase (IFS), involved in plant defense and root nodulation; isoflavone reductase (IFR), a key enzyme in phenylpropanoid phytoalexin biosynthesis; and caffeic acid-O-methyltransferase, a key enzyme in the biosynthesis of lignin cell wall precursors. High levels of CHS transcripts from plantlets infected with Herbaspirillum rubri or Gluconacetobacter diazotroficans suggests that agents of biotic stress can elicit flavonoid biosynthesis in sugarcane. From this data we have predicted the profile of isoprenoid and phenylpropanoid metabolism in sugarcane and pointed the branches of secondary metabolism activated during tissue-specific stages of development and the adaptive response of sugarcane to agents of biotic and abiotic stress, although our assignment of enzyme function should be confirmed by careful biochemical and genetic supporting evidence.Abstract in Portuguese:
A via de síntese de purino nucleotídeos é considerada uma via de central importância para todas as células. Na maioria dos organismos, os purino nucleotídeos são sintetizados ''de novo'' a partir de precursores não-nucleotídicos como amino ácidos, amônia e dióxido de carbono. O conhecimento das enzimas envolvidas na via de síntese de purinas da cana-de-açúcar vai abrir a possibilidade do uso dessas enzimas como alvos no desenho racional de inibidores no combate a agentes fitopatogênicos, como esta sendo feita com diversos parasitos e células cancerosas. A seguinte estratégia esta sendo utilizada na identificação de genes de cana-de-açúcar para cada membro da via de síntese de purinas: Seqüências representativas dos genes que compões a via foram escolhidas do banco de dados NCBI. Essas seqüências de peptídeos estão sendo utilizadas em buscas ao banco de dados gerado pelo SUCEST pelo programa BLAST (implementação tBLASTn). Alinhamentos com os clusters de cana-de-açúcar são posteriormente analisados para sua significância estatística pela implementação PRSS3 do algoritmo conhecido como Monte Carlo shuffling. Para calibrar a análise dos resultados de PRSS3, foram empregadas seqüências conhecidas de diferentes taxas ao longo da arvore filogenética. Essas seqüências são comparadas duas a duas e com o cluster da cana-de-açúcar. A tabela de valores-p resultante indica o grau estatístico de similaridade e divergência entre as seqüências já descritas e entre essas e os clusters de cana-de-açúcar. Os resultados obtidos dessas análises estão descritos neste artigo.Abstract in English:
Nucleotide synthesis is of central importance to all cells. In most organisms, the purine nucleotides are synthesized de novo from non-nucleotide precursors such as amino acids, ammonia and carbon dioxide. An understanding of the enzymes involved in sugarcane purine synthesis opens the possibility of using these enzymes as targets for chemicals which may be effective in combating phytopathogen. Such an approach has already been applied to several parasites and types of cancer. The strategy described in this paper was applied to identify sugarcane clusters for each step of the de novo purine synthesis pathway. Representative sequences of this pathway were chosen from the National Center for Biotechnology Information (NCBI) database and used to search the translated sugarcane expressed sequence tag (SUCEST) database using the available basic local alignment search tool (BLAST) facility. Retrieved clusters were further tested for the statistical significance of the alignment by an implementation (PRSS3) of the Monte Carlo shuffling algorithm calibrated using known protein sequences of divergent taxa along the phylogenetic tree. The sequences were compared to each other and to the sugarcane clusters selected using BLAST analysis, with the resulting table of p-values indicating the degree of divergence of each enzyme within different taxa and in relation to the sugarcane clusters. The results obtained by this strategy allowed us to identify the sugarcane proteins participating in the purine synthesis pathway.Abstract in Portuguese:
Seqüências do banco de dados SUCEST foram analisadas baseado em suas identidades com genes relacionados que codificam enzimas chalcone sintase (CHS). A seqüência da proteína CHS de sorgo (gi|12229613), foi usada para a busca de seqüências no banco de dados do SUCEST, que foram mais similares à CHS. Baseado na similaridade das seqüências de aminoácidos deduzidas, quatorze conjuntos formados por 121 seqüências, foram divididos em dois grupos. O primeiro grupo é mais similar à CHS de sorgo (EC 2.3.1.74) e apresenta a seqüência consenso do sítio ativo de chalcone e stilbene sintase. Análises da expressão gênica, baseada no número de seqüências de uma dada biblioteca presente em cada grupo, indicaram que neste caso, a maioria das seqüências são de bibliotecas preparadas de raíz e flores de cana-de-açúcar. O segundo grupo é mais similar à seqüência de aminoácidos deduzida de uma proteína, não caracterizada, induzida por patógeno (PI1, gi|9855801|) do banco de dados de EST de Sorghum bicolor. Estas duas seqüências de proteínas são 90% idênticas e tem duas mudanças de aminoácidos no consenso padrão de chalcone e stilbene sintase, e conservam o resíduo de cisteína na posição do sítio ativo. Esta EST não foi associada a chalcone sintase antes, e apresenta diferenças na seqüência consenso da CHS previamente descrita de sorgo. A maioria das seqüências do segundo grupo são de bibliotecas de cana-de-açúcar preparadas de raíz e plantas infectadas com Herbaspirillum rubrisubalbicans e Gluconacetobacter diazotroficans. Os resultados indicam que nós identificamos uma chalcone sintase, tal como a encontrada no banco de cDNA de sorgo em uma biblioteca induzida por patógeno, expressa em plantas de cana-de-açúcar, e que ambas as proteínas são novos membros da super família chalcone e stilbene sintase.Abstract in English:
Sequences from the sugarcane expressed sequence tag (SUCEST) database were analyzed based on their identities to genes encoding chalcone-synthase-like enzymes. The sorghum (Sorghum bicolor) chalcone-synthase (CHS, EC 2.3.1.74) protein sequence (gi|12229613) was used to search the SUCEST database for clusters of sequencing reads that were most similar to chalcone synthase. We found 121 reads with homology to sorghum chalcone synthase, which we were then able to sort into 14 clusters which themselves were divided into two groups (group 1 and group 2) based on the similarity of their deduced amino acid sequences. Clusters in group 1 were more similar to the sorghum enzyme than those in group 2, having the consensus sequence of the active site of chalcone and stilbene synthase. Analysis of gene expression (based on the number of reads from a specific library present in each group) indicated that most of the group 1 reads were from sugarcane flower and root libraries. Group 2 clusters were more similar to the amino acid sequence of an uncharacterized pathogen-induced protein (PI1, gi|9855801) from the S. bicolor expressed sequence tag (EST) database. The group 2 clusters sequences and PI1 proteins are 90% identical, having two amino acid changes at the chalcone and stilbene synthase consensi but conserving the cysteine residue at the active site. The PI1 EST has not been previously associated with chalcone synthase and has a different consensus sequence from the previously described chalcone synthase of sorghum. Most of the group 2 reads were from libraries prepared from sugarcane roots and plants infected with Herbaspirillum rubrisubalbicans and Gluconacetobacter diazotroficans. Our results indicate that we have identified a sugarcane chalcone synthase similar to the pathogen-induced PI1 protein found in the sorghum cDNA libraries, and it appears that both proteins represent new members of the chalcone and stilbene synthase super-family.Abstract in Portuguese:
Desde o isolamento da primeira proteína rica em glicina (GRP) em plantas, um grande número de novas GRPs vem sendo identificado. Seu padrão de expressão altamente específico, embora variado, em conjunto com as diferentes localizações sub-celulares de alguns dos tipos de GRPs, claramente indica que estas proteínas encontram-se envolvidas em diversos processos fisiológicos independentes. Embora ainda sem uma clara definição do papel de GRPs na célula vegetal, estudos realizados com estas proteínas têm resultado em novos e interessantes esclarecimentos da biologia celular e molecular de plantas. Promotores com regulação complexa, assim como distintos mecanismos de regulação da expressão gênica tem sido demonstrados. Novas vias de endereçamento de proteínas tais como a exportação de GRPs para diferentes tipos celulares, tem sido observados. Estes dados mostram que as GRPs podem constituir marcadores e/ou modelos interessantes para a compreensão de distintos aspectos da biologia vegetal. Neste trabalho, características estruturais e funcionais deste tipo de proteínas em cana-de-açúcar (Saccharum officinarum L.) foram analisadas. Uma vez que esta é a primeira descrição deste tipo de proteínas em cana-de-açúcar, especial atenção foi dada para o padrão de expressão destes genes, analisando-se a abundância e prevalência de cada um dos genes nas diferentes bibliotecas de cDNA do projeto Sequenciamento de ESTs de cana-de-açúcar (SUCEST). A comparação das GRPs de cana-de-açúcar com as GRPs descritas em outras espécies também será discutida.Abstract in English:
Since the isolation of the first glycine-rich proteins (GRPs) in plants a wealth of new GRPs have been identified. The highly specific but diverse expression pattern of grp genes, taken together with the distinct sub-cellular localization of some GRP groups, clearly indicate that these proteins are involved in several independent physiological processes. Notwithstanding the absence of a clear definition of the role of GRPs in plant cells, studies conducted with these proteins have provided new and interesting insights into the molecular biology and cell biology of plants. Complexly regulated promoters and distinct mechanisms for the regulation of gene expression have been demonstrated and new protein targeting pathways, as well as the exportation of GRPs from different cell types have been discovered. These data show that GRPs can be useful as markers and/or models to understand distinct aspects of plant biology. In this paper, the structural and functional features of these proteins in sugarcane (Saccharum officinarum L.) are summarized. Since this is the first description of GRPs in sugarcane, special emphasis has been given to the expression pattern of these GRP genes by studying their abundance and prevalence in the different cDNA-libraries of the Sugarcane Expressed Sequence Tag (SUCEST) project . The comparison of sugarcane GRPs with GRPs from other species is also discussed.Abstract in Portuguese:
Proteinases cisteínicas são peptidil-hidrolases dependentes de um resíduo de cisteína em seu sítio ativo. As propriedades físico-químicas destas proteinases têm sido amplamente caracterizadas, entretanto suas funções biológicas ainda não foram completamente elucidadas. Elas estão envolvidas em um grande número de eventos, tais como: processamento e degradação protéica, câncer, germinação, morte celular programada e processos de senescência. Diferentes proteinases cisteínicas, classificadas pelo Comitê de Nomenclatura da União Internacional de Bioquímica e Biologia Molecular (IUBMB) como pertencentes à sub-sub-classe E.C.3.4.22, foram usadas na busca de clusters no banco de dados do SUCEST (SUgarCane EST project), utilizando-s o programa T-BLAST-n. Homologia de seqüências foram encontradas com 76 clusters que correspondem a prováveis proteinases cisteínicas. O alinhamento destas seqüências com a de outras proteases cisteínicas, de diversas origens, forneceu informação quanto à classificação e possível função das proteinases de cana-de-açúcar. Além disso, o padrão de expressão de cada gene foi postulado a partir da correlação direta com as bibliotecas de cDNA do SUCEST dos quais os clusters foram derivados. Uma vez que nenhum gene de protease cisteínica foi anteriormente evidenciado em cana-de-açúcar, este estudo representa uma etapa inicial para o estudo de novos aspectos bioquímicos, fisiológicos e biotecnológicos destas enzimas.Abstract in English:
Cysteine proteases are peptidyl hydrolyses dependent on a cysteine residue at the active center. The physical and chemical properties of cysteine proteases have been extensively characterized, but their precise biological functions have not yet been completely understood, although it is known that they are involved in a number of events such as protein turnover, cancer, germination, programmed cell death and senescence. Protein sequences from different cysteine proteinases, classified as members of the E.C.3.4.22 sub-sub-class, were used to perform a T-BLAST-n search on the Brazilian Sugarcane Expressed Sequence Tags project (SUCEST) data bank. Sequence homology was found with 76 cluster sequences that corresponded to possible cysteine proteinases. The alignments of these SUCEST clusters with the sequence of cysteine proteinases of known origins provided important information about the classification and possible function of these sugarcane enzymes. Inferences about the expression pattern of each gene were made by direct correlation with the SUCEST cDNA libraries from which each cluster was derived. Since no previous reports of sugarcane cysteine proteinases genes exists, this study represents a first step in the study of new biochemical, physiological and biotechnological aspects of sugarcane cysteine proteases.Abstract in Portuguese:
Metaloproteases exercem papéis importantes em muitos processos fisiológicos em mamíferos tais como migração celular, remodelamento tecidual e processamento de fatores de crescimento. Estas enzimas estão envolvidas também na pato-fisiologia de um grande número de doenças humanas como hipertensão e câncer. Muitas bactérias patogênicas dependem de proteases para infectar o hospedeiro. Diversas classes de metaloproteases foram descritas em seres humanos, bactérias, venenos de serpentes e insetos. No entanto, a presença e a caracterização de metaloproteases em plantas estão pouco descritas na literatura. Neste trabalho, foi pesquisada a biblioteca de cDNA de etiquetas de seqüências expressas da cana-de-açúcar (SUCEST) para identificar, por homologia com seqüências depositadas em outros bancos de dados, famílias gênicas de metaloproteases expressas em diferentes condições. Foram utilizadas seqüências protéicas de Arabidopis thaliana e Glycine max e seqüências de nucleotídeos de Sorghum bicolor. Regiões conservadas correspondentes aos diferentes domínios e motivos de seqüência de metaloproteases foram identificadas nos cDNAs de cana-de-açúcar para caracterizar cada grupo de enzimas. Pelo menos quatro classes de metaloproteases foram identificadas na cana-deaçúcar, a saber, metaloproteases de matriz extracelular, zincinas, inverzincinas e metaloproteases dependentes de ATP. Cada uma destas classes foi analisada quanto a sua expressão nas diferentes condições e tecidos utilizados na construção das bibliotecas de cDNA.Abstract in English:
Metalloproteases play a key role in many physiological processes in mammals such as cell migration, tissue remodeling and processing of growth factors. They have also been identified as important factors in the patho-physiology of a number of human diseases, including cancer and hypertension. Many bacterial pathogens rely on proteases in order to infect the host. Several classes of metalloproteases have been described in humans, bacteria, snake venoms and insects. However, the presence and characterization of plant metalloproteases have rarely been described in the literature. In our research, we searched the sugarcane expressed sequence tag (SUCEST) DNA library in order to identify, by homology with sequences deposited in other databases, metalloprotease gene families expressed under different conditions. Protein sequences from Arabidopsis thaliana and Glycine max were used to search the SUCEST data bank. Conserved regions corresponding to different metalloprotease domains and sequence motifs were identified in the reads to characterize each group of enzymes. At least four classes of sugarcane metalloproteases have been identified, i.e. matrix metalloproteases, zincins, inverzincins, and ATP-dependent metalloproteases. Each enzyme class was analyzed for its expression in different conditions and tissues.Abstract in Portuguese:
As cistatinas são inibidores competitivos e reversíveis de proteinases cisteínicas, compondo uma superfamília de proteínas evolutivamente relacionadas. Esta superfamília está dividida em três famílias: a primeira, das estefinas, é composta de proteínas destituídas de pontes de enxofre; a segunda, das cistatinas, agrupa proteínas que possuem pontes de sulfeto; a terceira família, dos kininogênios, se caracteriza por ser formada por glicoproteínas de alto peso molecular com três domínios repetidos similares aos da família das cistatinas. As fitocistatinas constituem uma família de cistatinas que possui representantes exclusivamente em plantas. Elas são proteínas que não possuem pontes de enxofre e contém uma seqüência conservada L-A-R-[FY]-A-[VI]-X3-N na região N-terminal. Neste trabalho nos usamos seqüências derivadas de sete fitocistatinas, identificadas no projeto genoma de Arabidopsis, para identificar possíveis membros da superfamília das cistatinas presentes no banco de dados de cana-de-açúcar do SUCEST. Foram identificadas vinte e cinco possíveis fitocistatinas de cana-de-açúcar. Uma análise filogenética permitiu agrupar as fitocistatinas em quatro grupos: (i) contendo o consenso N-terminal ; (ii) contendo o consenso N-terminal e mais uma extensão C-terminal; (iii) destituído do consenso N-terminal e (iv) destituído do consenso N-terminal e do motivo conservado QxVxG encontrado em todos os membros da superfamília.Abstract in English:
The cystatins are tightly binding, but reversible, inhibitors of cysteine proteinases, which constitute a superfamily of evolutionary related proteins. They have been subdivided into three families: the cystatin family which contain two disulfide bonds, the stefin family which lack disulfide bonds, and the kininogen family composed of large glycoproteins containing three repeats similar to those found in the cystatin family. Members of the cystatin superfamily occurring in plants are currently known as phytocystatins, defined as proteins lacking disulfide bonds but possessing a conserved N-terminal amino acid sequence (L-A-R-[FY]-A-[VI]-X(3)-N). We have used the protein sequence deduced from seven phytocystatins (from the Arabidopsis thaliana genome project) and from the SUgarCane EST project (SUCEST) database to identify 25 possible sugarcane phytocystatins. Phylogenetic analysis has allowed us to cluster these phytocystatins into four distinct groups: (i) those with a characteristic N-terminal consensus, (ii) those with the same consensus plus a long C-terminal extension; (iii) those that lack the consensus but contain the highly conserved QxVxG motif found in all members of the superfamily and (iv) those that lack both the consensus and the QxVxG motif.