Seqüências do banco de dados SUCEST foram analisadas baseado em suas identidades com genes relacionados que codificam enzimas chalcone sintase (CHS). A seqüência da proteína CHS de sorgo (gi|12229613), foi usada para a busca de seqüências no banco de dados do SUCEST, que foram mais similares à CHS. Baseado na similaridade das seqüências de aminoácidos deduzidas, quatorze conjuntos formados por 121 seqüências, foram divididos em dois grupos. O primeiro grupo é mais similar à CHS de sorgo (EC 2.3.1.74) e apresenta a seqüência consenso do sítio ativo de chalcone e stilbene sintase. Análises da expressão gênica, baseada no número de seqüências de uma dada biblioteca presente em cada grupo, indicaram que neste caso, a maioria das seqüências são de bibliotecas preparadas de raíz e flores de cana-de-açúcar. O segundo grupo é mais similar à seqüência de aminoácidos deduzida de uma proteína, não caracterizada, induzida por patógeno (PI1, gi|9855801|) do banco de dados de EST de Sorghum bicolor. Estas duas seqüências de proteínas são 90% idênticas e tem duas mudanças de aminoácidos no consenso padrão de chalcone e stilbene sintase, e conservam o resíduo de cisteína na posição do sítio ativo. Esta EST não foi associada a chalcone sintase antes, e apresenta diferenças na seqüência consenso da CHS previamente descrita de sorgo. A maioria das seqüências do segundo grupo são de bibliotecas de cana-de-açúcar preparadas de raíz e plantas infectadas com Herbaspirillum rubrisubalbicans e Gluconacetobacter diazotroficans. Os resultados indicam que nós identificamos uma chalcone sintase, tal como a encontrada no banco de cDNA de sorgo em uma biblioteca induzida por patógeno, expressa em plantas de cana-de-açúcar, e que ambas as proteínas são novos membros da super família chalcone e stilbene sintase.