表1 膳食生物标志物总结Tab.1 Summary of dietary biomarkers |
| 食物种类 | 生物样本 | 鉴定方法 | 生物标志物 |
|---|---|---|---|
| 全谷物 | 血液、尿液、 脂肪组织 | LC-MS/MS、 GC-MS、LC-MS、 UPLC-MS、HPLC、 HPLC-MS、 HPLC-CEAD、 LC-QTOF-MS | alkylresorcinols (ARs)[27-36] 3-(3,5-dihydroxyphenyl)-1-propanoicacid (DHPPA)[36-40] 3,5-dihydroxycinnamic acid (DHCA)[41-42] 3,5-dihydroxy-benzoic acid (DHBA)[38] 2-(3,5-dihydroxybenzamido) acetic acid[41] 5-(3,5-dihydroxyphenyl) pentanoic acid (DHPPTA)[41-42] pipecolic acid betaine[43-44] tetradecanedioic acid[43] avenanthramides (AVNs)[45-46] avenacosides (AVEs)[47] |
| 果蔬类 | 血液、尿液 | UPLC-MS/MS、HPLC-MS/MS、HPLC-DAD-MS、UPLC-QTOF、 UPLC-ESI-MS-MS、 NMR、MSI-CE-MS、 LC-MS/MS、UHPLC-QTOF-MS、HPLC-DAD、 GC-MS、HPLC、 CE-TOF-MS | aalliin[48-50] aS-allylcysteine[50-51] aN-acetylalliin[50] dhesperetin[52-54] dnaringenin[52-54] dhesperidin[52-54] dnarringin[52-54] dstachydrine[50] dproline betaine[52,55 -56] ephloretin[54,57 -58] ephloretin glucuronide[58] ephloretin glucuronide sulfate[58] gdes-amino arginine pentenol ester[59] gD/L-malic acid ester of cis-p-coumarate[59] gD/L-malic acid ester of trans-p-coumarate[59] bergothioneine[48,50,60] ccyanidin-3-glucoside[61] fdopamine sulfate[53,62 -63] carotenoids[64-67] threonate[68] galactarate[68] hippurate[69] hippuric acid[56] 3-carboxy-4-methyl-5-propyl-2-furanpropanoic acid (CMPF)[60] |
| 肉类 | 血液、尿液 | MSI-CE-MS、 FIA-MS/MS、 CE-TOF-MS、 UPLC-MS/MS、 UHPLC-QTOF-MS、 LC-MS/MS、 NMR、MS、LC-MS | hsyringol sulfate[70] jpiperine[71] ianserine[70,72] i3-methylhistidine (3-MH)[56,73] iguanidoacetate[74] carnosine[70] acetylcarnitine[73] vanillylmandelate[69] 4-hydroxyproline propionylcarnitine (PPC)[60,68,73] |
| 鱼类及贝类 | 血液、尿液 | MSI-CE-MS、 CE-TOF-MS、 UHPLC、HPLC、 UPLC-MS/MS、 GC-MS、LC-MS/MS、 MS/MS、 HPLC-ICP-MS | trimetlylamine-N-oxide (TMAO)[56,68,72,75 -76] 3-carboxy-4-methyl-5-propyl-2-furanpropanoic acid (CMPF)[50,77 -78] docosahexaenoic (DHA)[35,50,78] eicosapentaenoic (EPA)[35,50,60,79] docosapentaenoic acid (DPA)[35] acetylcarnitine[72] arsenobetaine[80] 2-hydroxybutyrate[78] erythrocyte mercury[80] 1-methylhistidine[76] |
| 乳制品 | 血液、尿液、 脂肪组织、粪便 | MS/MS、GC-MS、HILIC、GC、LC-MS、CE-TOF-MS、 1H NMR | pentadecanoacid[60,81 -85] heptadecanoic acid[82,84 -85] trans-palmitoleic acid[82,85 -86] galactonic acid[87] threonate[68] phenylalanine[68] myristic acid[60,84] kgalactonate[68,88] klactose[88] kgalactonate[88] kLewis A trisaccharide (LeA)[87] kblood group H disaccharide (BGH)[87] lpantothenate[84] lproline[84,88 -89] l3-phenyllactic acid[88-89] |
| 豆类 | 血液、尿液 | GC-MS、1H NMR、LC-MS、UPLC- MS/MS、MSI-CE-MS、ELISA | genistein[90-91] daidzein[90-91] S-methylcysteine[48,92] pipecolic acid[92] tryptophan betaine[56] |
| 坚果 | 血液、尿液、粪便 | LC-MS、HPLC- MS、GC-MS、 HPLC-DAD-MS、 HPLC、ELISA、LC-ESI-QTOF-MS、 LC-MS/MS | mα-linolenic acid[93-94] mγ-tocopherol[95] selenium[96] α-tocopherol[97] murolithins[95] murolithin A glucuronide[98] lutein-zeaxanthin[99-100] m5-hydroxyindoleacetic acid (5-HIAA)[101] tryptophan betaine[56,78] 5-hydroxyindole-3acetic acid[102] |
注:a.大蒜及葱属类;b.蘑菇;c.浆果类;d.柑橘类;e.苹果;f.香蕉;g.菠菜;h.熏肉;i.鸡肉;j.香肠;k.牛奶;l.奶酪;m.核桃。 |
1 不同种类食物的膳食生物标志物
1.1 全谷物生物标志物
1.2 果蔬类生物标志物
1.3 肉类和鱼类生物标志物
1.4 乳制品生物标志物
1.5 坚果和豆类生物标志物
2 利用膳食生物标志物探索饮食与代谢疾病的关系
2.1 全谷物生物标志物与代谢疾病的关系
2.2 果蔬生物标志物与代谢疾病的关系
2.3 肉类及鱼类生物标志物与代谢疾病的关系
2.4 膳食脂肪酸生物标志物与代谢疾病的关系
2.5 其他膳食生物标志物与代谢疾病的关系
3 膳食生物标志物研究及应用挑战
3.1 研究设计
3.2 食物成分复杂且个体差异显著
3.3 代谢组学数据处理难度升级
表2 筛选膳食生物标志物的常见统计方法Tab.2 Statistical methods used for screening dietary biomarkers |
| 统计方法 | 优缺点 |
|---|---|
| T test、Mann Whitney、Chi-square、 ANOVA、Kruskal Wallis | √算法简单,结果容易解读。 ×只能分析一个因素对结果的影响,而实际问题往往是多个因素共同作用的结果。 ×不考虑代谢物之间的共线性及相关性。 |
| 多元线性回归(multiple linear regression) | √算法简单,结果容易解读。 ×样本量影响变量显著性。 ×不考虑多因素的共线性及相关性。 ×实际应用过程中模型混杂因素的筛选很重要,会直接影响生物标志物与饮食暴露之间的相关性。 |
| 岭回归(ridge regression)和套索回归(lasso regression) | √解决多重共线性数据的有偏估计回归方法。 √利用AIC准则和BIC准则精炼简化统计模型的变量集合,对多维复杂数据有效降维。 √防止过拟合,又可以实现特征变量选择。 ×算法较难,需要扎实的统计学基础。 ×模型构建和变量选择需要交互验证。 |
| 主成分分析(principle component analysis)、LDA(latent dirichlet allocation)、主坐标分析(principal co-ordinates analysis)、多维尺度分析(multidimensional scaling) | √无监督学习算法,无需先验知识。 √大规模人群数据分析中可用于检测异常样本。 √基于对象数据的方向和重要度实现有效降维。 √可视化程度高。 ×无显著性检验。 ×不能基于变量对模型构建的重要性进行特征代谢物筛选和排序。 |
| 偏最小二乘回归分析(partial least square regression analysis)、偏最小二乘判别分析(partial least square discriminant analysis)、正交偏最小二乘判别分析(orthogonal partial least square discriminant analysis)、稀疏偏最小二乘分析(sparse partial least square analysis) | √有监督学习算法,通过投影分别将预测变量和观测变量投影到新空间构建预测模型。 √对大规模复杂变量集合实施降维。 √可视化程度高。 √稀疏偏最小二乘分析可在PLS基础上实现特征变量选择。 ×高维变量小样本数据情况下模型易过拟合,须采用交互验证和置换检验手段优化模型。 ×需要评估模型预测能力。 ×注意生物标志物选择假阳性问题。 |
| 随机森林(random forest) | √基于if-then-else规则的有监督学习算法,可用于分类问题,也可解决回归问题。 √可以处理缺失值,且少量缺失值对模型效果影响不大。 √可以处理复杂数据,且对异常值稳健性强。 √可以分析代谢物之间以及代谢物与饮食暴露之间的复杂关系。 √可以判断特征变量的重要程度,进而有助于标志物筛选。 √模型不容易过拟合。 ×主要参数(决策树和节点)的选择会影响模型结果和预测效果。 ×当样本量大、决策树个数多时,训练速度较慢。 |
| 人工神经网络(artificial neural networks) | √由大量处理单元互联组成的非线性、自适应信息处理系统,适用于处理含有较多与研究问题无关噪声的复杂数据。 ד黑匣子”性质,对统计学基础要求较高。 ×模型训练速度较慢。 |