本申請涉及生物信息分析,具體涉及轉(zhuǎn)錄因子分析,尤其涉及一種轉(zhuǎn)錄因子分析方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、轉(zhuǎn)錄因子在物種的生長發(fā)育、環(huán)境應(yīng)答和生長周期調(diào)控等生物過程中發(fā)揮重要作用,對物種的轉(zhuǎn)錄因子進(jìn)行調(diào)控網(wǎng)絡(luò)分析可以為基因功能研究、疾病發(fā)生發(fā)展機制研究、藥物研發(fā)等提供重要的數(shù)據(jù)支持和指導(dǎo)。目前,現(xiàn)有的轉(zhuǎn)錄因子數(shù)據(jù)庫中基序矩陣文件的格式和注釋相對混亂,且尚未有適用于非模式植物轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)分析的自動化流程,導(dǎo)致對待分析物種進(jìn)行轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)分析的效率較低。
技術(shù)實現(xiàn)思路
1、鑒于以上內(nèi)容,有必要提出一種轉(zhuǎn)錄因子分析方法、裝置、電子設(shè)備及存儲介質(zhì),以解決轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)分析效率低的技術(shù)問題。
2、本申請?zhí)峁┺D(zhuǎn)錄因子分析方法,所述方法包括:獲取待分析物種的蛋白質(zhì)序列,以及所述蛋白質(zhì)序列的多個目標(biāo)轉(zhuǎn)錄因子;通過對所述多個目標(biāo)轉(zhuǎn)錄因子和預(yù)存的模板轉(zhuǎn)錄因子進(jìn)行同源性分析,確定每個目標(biāo)轉(zhuǎn)錄因子對應(yīng)的目標(biāo)基序;對所述每個目標(biāo)轉(zhuǎn)錄因子及對應(yīng)的目標(biāo)基序進(jìn)行共表達(dá)分析,得到所述每個目標(biāo)轉(zhuǎn)錄因子的共表達(dá)模塊;基于所述目標(biāo)基序篩選所述共表達(dá)模塊,得到每個所述目標(biāo)轉(zhuǎn)錄因子對應(yīng)的調(diào)控子;通過計算所述調(diào)控子的活性得分,得到所述待分析物種的轉(zhuǎn)錄因子分析結(jié)果。
3、在一些實施例中,獲取所述預(yù)存的模板轉(zhuǎn)錄因子的方法包括:從多個數(shù)據(jù)庫中獲取多個示例物種的示例轉(zhuǎn)錄因子及對應(yīng)的示例基序;當(dāng)多個所述示例轉(zhuǎn)錄因子屬于相同的示例物種且屬于不同的數(shù)據(jù)庫時,保留多個所述示例轉(zhuǎn)錄因子中的任意一個示例轉(zhuǎn)錄因子及其對應(yīng)的示例基序;轉(zhuǎn)換所述示例轉(zhuǎn)錄因子與示例基序為統(tǒng)一格式,得到所述模板轉(zhuǎn)錄因子及對應(yīng)的模板基序。
4、在一些實施例中,所述模板轉(zhuǎn)錄因子對應(yīng)于模板基序,所述通過對所述多個目標(biāo)轉(zhuǎn)錄因子和預(yù)存的模板轉(zhuǎn)錄因子進(jìn)行同源性分析,確定每個目標(biāo)轉(zhuǎn)錄因子對應(yīng)的目標(biāo)基序包括:計算每個目標(biāo)轉(zhuǎn)錄因子與每個模板轉(zhuǎn)錄因子的同源性得分;確定最高同源性得分對應(yīng)的模板轉(zhuǎn)錄因子的基序為目標(biāo)基序。
5、在一些實施例中,所述計算每個目標(biāo)轉(zhuǎn)錄因子與每個模板轉(zhuǎn)錄因子的同源性得分包括:劃分所述目標(biāo)轉(zhuǎn)錄因子,得到所述目標(biāo)轉(zhuǎn)錄因子對應(yīng)的多個第一子序列;劃分所述模板轉(zhuǎn)錄因子,得到所述模板轉(zhuǎn)錄因子對應(yīng)的多個第二子序列;當(dāng)任意一個第一子序列與任意一個第二子序列相同時,確定所述第一子序列的長度為候選同源性得分;確定所述候選同源性得分中的最大值作為所述目標(biāo)轉(zhuǎn)錄因子與所述模板轉(zhuǎn)錄因子的同源性得分。
6、在一些實施例中,所述共表達(dá)模塊包括所述目標(biāo)轉(zhuǎn)錄因子的靶基因,所述基于所述目標(biāo)基序篩選所述共表達(dá)模塊,得到每個所述目標(biāo)轉(zhuǎn)錄因子對應(yīng)的調(diào)控子包括:計算所述目標(biāo)轉(zhuǎn)錄因子在對應(yīng)的靶基因中的富集得分;確定所述目標(biāo)轉(zhuǎn)錄因子與對應(yīng)的靶基因的結(jié)合位點;當(dāng)所述共表達(dá)模塊中的目標(biāo)轉(zhuǎn)錄因子對應(yīng)的目標(biāo)基序在所述靶基因的結(jié)合位點的上游,且所述富集得分大于預(yù)設(shè)閾值,確定所述共表達(dá)模塊為調(diào)控子。
7、在一些實施例中,所述計算所述目標(biāo)轉(zhuǎn)錄因子在對應(yīng)的所述靶基因中的富集得分包括:計算所述目標(biāo)轉(zhuǎn)錄因子的目標(biāo)基序在所述靶基因中出現(xiàn)的第一頻率;計算所述目標(biāo)轉(zhuǎn)錄因子的目標(biāo)基序在所述蛋白質(zhì)序列中出現(xiàn)的第二頻率;計算所述第一頻率與所述第二頻率的比值,得到所述目標(biāo)轉(zhuǎn)錄因子在對應(yīng)的所述靶基因中的富集得分。
8、在一些實施例中,所述通過計算所述調(diào)控子的活性得分,得到所述待分析物種的轉(zhuǎn)錄因子分析結(jié)果包括:確定所述調(diào)控子中包含所述目標(biāo)轉(zhuǎn)錄因子的結(jié)合位點的所述靶基因;根據(jù)所述富集得分計算所述調(diào)控子的auc得分,獲得所述調(diào)控子的活性得分。
9、本申請實施例還提供一種轉(zhuǎn)錄因子分析裝置,所述裝置包括:接收模塊,用于接收待分析物種的蛋白質(zhì)序列;分析模塊,用于預(yù)測所述蛋白質(zhì)序列的多個目標(biāo)轉(zhuǎn)錄因子;所述分析模塊,還用于通過對所述多個目標(biāo)轉(zhuǎn)錄因子和預(yù)存的模板轉(zhuǎn)錄因子進(jìn)行同源性分析,確定每個目標(biāo)轉(zhuǎn)錄因子對應(yīng)的目標(biāo)基序;所述分析模塊,還用于對所述每個目標(biāo)轉(zhuǎn)錄因子及對應(yīng)的目標(biāo)基序進(jìn)行共表達(dá)分析,得到所述每個目標(biāo)轉(zhuǎn)錄因子的共表達(dá)模塊;所述分析模塊,還用于基于所述目標(biāo)基序篩選所述共表達(dá)模塊,得到每個所述目標(biāo)轉(zhuǎn)錄因子對應(yīng)的調(diào)控子;所述分析模塊,還用于通過計算所述調(diào)控子的活性得分,得到所述待分析物種的轉(zhuǎn)錄因子分析結(jié)果。
10、本申請實施例還提供一種電子設(shè)備,所述電子設(shè)備包括:
11、存儲器,存儲至少一個指令;
12、處理器,執(zhí)行所述存儲器中存儲的指令以實現(xiàn)所述的轉(zhuǎn)錄因子分析方法。
13、本申請實施例還提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)中存儲有至少一個指令,所述至少一個指令被電子設(shè)備中的處理器執(zhí)行以實現(xiàn)所述的轉(zhuǎn)錄因子分析方法。
14、由以上技術(shù)方案可以看出,本申請實施例通過對待分析物種的目標(biāo)轉(zhuǎn)錄因子和預(yù)存的模板轉(zhuǎn)錄因子進(jìn)行同源性分析,確定目標(biāo)轉(zhuǎn)錄因子對應(yīng)的基序,為后續(xù)進(jìn)行待分析物種的轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)分析提供了數(shù)據(jù)支撐。然后對轉(zhuǎn)錄因子及對應(yīng)的基序進(jìn)行共表達(dá)分析,得到轉(zhuǎn)錄因子的共表達(dá)模塊,并基于所述基序篩選所述共表達(dá)模塊,得到每個所述目標(biāo)轉(zhuǎn)錄因子對應(yīng)的調(diào)控子,能夠提升目標(biāo)轉(zhuǎn)錄因子的數(shù)據(jù)質(zhì)量,從而提升轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)分析的效率。再通過計算所述調(diào)控子的活性得分,得到所述待分析物種的轉(zhuǎn)錄因子分析結(jié)果,能夠?qū)崿F(xiàn)對待分析物種自動化地進(jìn)行轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)分析,從而提升轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)分析的效率。
1.一種轉(zhuǎn)錄因子分析方法,應(yīng)用于電子設(shè)備,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的轉(zhuǎn)錄因子分析方法,其特征在于,獲取所述預(yù)存的模板轉(zhuǎn)錄因子的方法包括:
3.如權(quán)利要求1所述的轉(zhuǎn)錄因子分析方法,其特征在于,所述模板轉(zhuǎn)錄因子對應(yīng)于模板基序,所述通過對所述多個目標(biāo)轉(zhuǎn)錄因子和預(yù)存的模板轉(zhuǎn)錄因子進(jìn)行同源性分析,確定每個目標(biāo)轉(zhuǎn)錄因子對應(yīng)的目標(biāo)基序包括:
4.如權(quán)利要求3所述的轉(zhuǎn)錄因子分析方法,其特征在于,所述計算每個目標(biāo)轉(zhuǎn)錄因子與每個模板轉(zhuǎn)錄因子的同源性得分包括:
5.如權(quán)利要求1所述的轉(zhuǎn)錄因子分析方法,其特征在于,所述共表達(dá)模塊包括所述目標(biāo)轉(zhuǎn)錄因子的靶基因,所述基于所述目標(biāo)基序篩選所述共表達(dá)模塊,得到每個所述目標(biāo)轉(zhuǎn)錄因子對應(yīng)的調(diào)控子包括:
6.如權(quán)利要求5所述的轉(zhuǎn)錄因子分析方法,其特征在于,所述計算所述目標(biāo)轉(zhuǎn)錄因子在對應(yīng)的所述靶基因中的富集得分包括:
7.如權(quán)利要求5所述的轉(zhuǎn)錄因子分析方法,其特征在于,所述通過計算所述調(diào)控子的活性得分,得到所述待分析物種的轉(zhuǎn)錄因子分析結(jié)果包括:
8.一種轉(zhuǎn)錄因子分析裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機可讀指令,所述計算機可讀指令被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7中任一項所述的轉(zhuǎn)錄因子分析方法。