Skip to main content

Table 6 Statistical parameters and equations of the best models developed for each chemical dataset analyzed

From: Examining the predictive accuracy of the novel 3D N-linear algebraic molecular codifications on benchmark datasets

Size

R 2

\(\left( {Q_{\text{loo}}^{2} } \right)\)

\(\left( {Q_{\text{boot}}^{2} } \right)\)

a(Q 2)

\(\left( {Q_{\text{ext}}^{2} } \right)\)

SDEPext

Modelsa

ACE dataset

 6

0.814

0.7756

0.765

−0.169

0.7422

1.078

Act = 1.576 (±1.283) + 0.132 (±0.018) \({}_{{\varvec{NS}2}}^{{\varvec{SD}}} \varvec{TrC}_{\varvec{e}}^{{\varvec{M}20\left( {\varvec{M}4} \right)}}\) − 17.977 (±3.649) \({}_{{\varvec{SS}2}}^{{\varvec{RA}}} \varvec{B}_{{\varvec{a} - \varvec{c}}}^{{\varvec{M}1}}\) + 2.135 (±0.398) \({}_{{\varvec{SS}0}}^{{\varvec{RA}}} \varvec{B}_{{\varvec{a} - \varvec{e}}}^{{}}\) − 3.900 (±0.772) \({}_{{\varvec{SS}1}}^{{\varvec{RA}}} \varvec{F}_{\varvec{a}}^{{\varvec{M}1}}\) + 0.034 (±0.013) \(\left[ {{}_{{\varvec{NS}3}}^{{\varvec{AC}\left[ 3 \right]\_\varvec{K}}} \varvec{TrC}_{\varvec{c}}^{{\varvec{M}20\left( {\varvec{M}16} \right)}} } \right]^{D}\) − 0.114 (±0.071) \(\left[ {{}_{{\varvec{MP}1}}^{{\varvec{RA}}} \varvec{QuQd}_{\varvec{e}}^{{\varvec{M}29}} } \right]^{\varvec{X}}\)

ACHE dataset

 8

0.738

0.6574

0.626

−0.213

0.6309

0.784

Act = 7.622 (±0.564) − 0.010 (±0.004) \({}_{{\varvec{SS}4}}^{{\varvec{i}50}} \varvec{TrQB}_{{\varvec{e} - \varvec{v}}}^{{\varvec{M}21\left( {\varvec{M}3} \right)}}\) − 0.204 (±0.046) \({}_{{\varvec{NS}4}}^{\varvec{K}} \varvec{Tr}_{{\varvec{a} - \varvec{e} - \varvec{h}}}^{{\varvec{M}21\left( {\varvec{M}1} \right)}}\) + 3.311 (±0.673) \({}_{{\varvec{SS}1}}^{{\varvec{i}50}} \varvec{B}_{{\varvec{a} - \varvec{h}}}^{{\varvec{M}1}}\) − 111.324 (±30.793) \({}_{{\varvec{MP}2}}^{{\varvec{i}50}} \varvec{F}_{\varvec{a}}^{{\varvec{M}1}}\) − 0.413 (±0.156) \({}_{{\varvec{SS}7}}^{{\varvec{ES}\_\varvec{SD}}} \varvec{TrB}_{{\varvec{a} - \varvec{e}}}^{{\varvec{M}21\left( {\varvec{M}13} \right)}}\) − 0.647 (±0.201) \({}_{{\varvec{NS}4}}^{{\varvec{TS}\left[ 2 \right]\_\varvec{K}}} \varvec{B}_{{\varvec{a} - \varvec{v}}}^{{\varvec{M}4}}\) + 0.022 (±0.011) \(\left[ {{}_{{\varvec{NS}4}}^{\varvec{K}} \varvec{Tr}_{{\varvec{a} - \varvec{e} - \varvec{h}}}^{{\varvec{M}21\left( {\varvec{M}1} \right)}} } \right]^{\varvec{A}}\) − 1.747 (±0.699) \(\left[ {{}_{{\varvec{SS}1}}^{{\varvec{i}50}} \varvec{B}_{{\varvec{a} - \varvec{h}}}^{{\varvec{M}1}} } \right]^{\varvec{P}}\)

BZR dataset

 9

0.754

0.6931

0.669

−0.170

0.5692

0.631

Act = 8.589 (±0.592) + 0.160 (±0.024) \({}_{{\varvec{SS}7}}^{{\varvec{TS}\left[ 4 \right]\_\varvec{K}}} \varvec{Tr}_{{\varvec{a} - \varvec{e} - \varvec{h}}}^{{\varvec{M}19\left( {\varvec{M}11} \right)}}\) + 0.416 (±0.076) \({}_{{\varvec{SS}1}}^{{\varvec{RA}}} \varvec{B}_{{\varvec{c} - \varvec{v}}}^{{\varvec{M}2}}\) + 0.018 (±0.006) \({}_{{\varvec{SS}2}}^{{\varvec{i}50}} \varvec{TrB}_{{\varvec{e} - \varvec{v}}}^{{\varvec{M}19\left( {\varvec{M}16} \right)}}\) + 0.092 (±0.034) \({}_{{\varvec{NS}2}}^{{\varvec{TS}\left[ 7 \right]\_\varvec{K}}} \varvec{Tr}_{{\varvec{a} - \varvec{h} - \varvec{c}}}^{{\varvec{M}27}}\) + 0.030 (±0.010) \({}_{{\varvec{NS}2}}^{{\varvec{AC}\left[ 1 \right]\_\varvec{K}}} \varvec{B}_{{\varvec{c} - \varvec{e}}}^{{\varvec{M}2}}\) − 7.940 (±2.981) \({}_{{\varvec{SS}0}}^{{\varvec{TS}\left[ 4 \right]\_\varvec{i}50}} \varvec{B}_{{\varvec{a} - \varvec{c}}}^{{}}\) − 0.009 (±0.005) \(\left[ {{}_{{\varvec{SS}4}}^{{\varvec{AC}\left[ 4 \right]\_\varvec{K}}} \varvec{TrB}_{{\varvec{e} - \varvec{v}}}^{{\varvec{M}20\left( {\varvec{M}13} \right)}} } \right]^{D}\) + 0. (±0.) \(\left[ {{}_{{\varvec{NS}4}}^{{\varvec{AM}}} \varvec{QuQd}_{\varvec{v}}^{{\varvec{M}26\left( {\varvec{M}8} \right)}} } \right]^{C}\) + 0. (±0.) \(\left[ {{}_{{\varvec{NS}4}}^{{\varvec{AM}}} \varvec{QuQd}_{\varvec{v}}^{{\varvec{M}26\left( {\varvec{M}8} \right)}} } \right]^{P}\)

COX2 dataset

 9

0.670

0.6313

0.615

−0.091

0.4932

1.038

Act = –94.390 (±8.607) + 1.759 (±0.150) \({}_{{\varvec{MP}3}}^{{\varvec{ES}\_\varvec{N}1}} \varvec{B}_{{\varvec{v} - \varvec{e}}}^{{\varvec{M}3}}\) − 0.032 (±0.007) \({}_{{\varvec{NS}4}}^{{\varvec{AC}\left[ 1 \right]\_\varvec{K}}} \varvec{B}_{{\varvec{a} - \varvec{e}}}^{{\varvec{M}13}}\) + 0.317 (±0.070) \({}_{{\varvec{SS}0}}^{{\varvec{ES}\_\varvec{i}50}} \varvec{B}_{{\varvec{h} - \varvec{e}}}\) + 0.005 (±0.002) \({}_{{\varvec{SS}2}}^{{\varvec{SD}}} \varvec{TrQB}_{{\varvec{v} - \varvec{h}}}^{{\varvec{M}20\left( {\varvec{M}16} \right)}}\) + 0.021 (±0.005) \({}_{{\varvec{NS}4}}^{{\varvec{TS}\left[ 5 \right]\_\varvec{K}}} \varvec{B}_{{\varvec{a} - \varvec{c}}}^{{\varvec{M}11}}\) + 0.081 (±0.017) \({}_{{\varvec{NS}2}}^{{\varvec{AC}\left[ 1 \right]\_\varvec{K}}} \varvec{B}_{{\varvec{c} - \varvec{e}}}^{{\varvec{M}8}}\) − 17.442 (±3.695) \(\left[ {{}_{{\varvec{SS}4}}^{{\varvec{SD}}} \varvec{QuCB}_{{\varvec{h} - \varvec{c}}}^{{\varvec{M}26\left( {\varvec{M}8} \right)}} } \right]^{\varvec{D}}\) − 14.761 (±2.510) \(\left[ {{}_{{\varvec{SS}4}}^{{\varvec{SD}}} \varvec{QuCB}_{{\varvec{h} - \varvec{c}}}^{{\varvec{M}26\left( {\varvec{M}8} \right)}} } \right]^{\varvec{M}}\) + 122.311 (±50.893) \(\left[ {{}_{{\varvec{MP}1}}^{{\varvec{SD}}} \varvec{Tr}_{{\varvec{a} - \varvec{h} - \varvec{c}}}^{{\varvec{M}20\left( {\varvec{M}16} \right)}} } \right]^{X}\)

DHFR dataset

 9

0.732

0.7055

0.697

−0.077

0.6405

0.826

Act = 3.127 (±0.519) + 0.019 (±0.005) \({}_{{\varvec{SS}1}}^{{\varvec{RA}}} \varvec{TrB}_{{\varvec{e} - \varvec{v}}}^{{\varvec{M}21\left( {\varvec{M}2} \right)}}\) + 0.050 (±0.007) \({}_{{\varvec{NS}6}}^{{\varvec{GV}\left[ 4 \right]\_\varvec{K}}} \varvec{B}_{{\varvec{c} - \varvec{e}}}^{{\varvec{M}4}}\) − 15.592 (±3.530) \({}_{{\varvec{MP}4}}^{{\varvec{TS}\left[ 2 \right]\_\varvec{i}50}} \varvec{QuQd}_{\varvec{m}}^{{\varvec{M}25\left( {\varvec{M}3} \right)}}\) − 0.067 (±0.007) \({}_{{\varvec{NS}2}}^{{\varvec{GV}\left[ 3 \right]\_\varvec{K}}} \varvec{B}_{{\varvec{a} - \varvec{c}}}^{{\varvec{M}1}}\) + 0.471 (±0.034) \({}_{{\varvec{NS}3}}^{{\varvec{GV}\left[ 1 \right]\_\varvec{K}}} \varvec{B}_{{\varvec{h} - \varvec{c}}}^{{\varvec{M}3}}\) − 0.325 (±0.037) \({}_{{\varvec{NS}1}}^{{\varvec{TS}\left[ 4 \right]\_\varvec{N}1}} \varvec{B}_{{\varvec{c} - \varvec{e}}}^{{\varvec{M}1}}\) + 55.107 (±10.603) \({}_{{\varvec{NS}1}}^{{\varvec{GV}\left[ 5 \right]\_\varvec{SD}}} \varvec{B}_{{\varvec{c} - \varvec{e}}}^{{\varvec{M}3}}\) + 0.044 (±0.008) \({}_{{\varvec{NS}2}}^{{\varvec{TS}\left[ 3 \right]\_\varvec{SD}}} \varvec{B}_{{\varvec{v} - \varvec{e}}}^{{\varvec{M}4}}\) − 0.933 (±0.331) \({}_{{\varvec{MP}4}}^{{\varvec{N}1}} \varvec{Qu}_{{\varvec{e} - \varvec{v} - \varvec{h} - \varvec{c}}}^{{\varvec{M}26\left( {\varvec{M}3} \right)}}\)

GPB dataset

 8

0.893

0.8124

0.774

−0.394

0.8283

0.499

Act = 2.073 (±0.351) + 0.334 (±0.078) \({}_{{\varvec{SS}3}}^{{\varvec{TS}\left[ 4 \right]\_\varvec{K}}} \varvec{TrB}_{{\varvec{e} - \varvec{h}}}^{{\varvec{M}20\left( {\varvec{M}8} \right)}}\) + 0.147 (±0.051) \({}_{{\varvec{NS}2}}^{{\varvec{AC}\left[ 3 \right]\_\varvec{K}}} \varvec{F}_{\varvec{e}}^{{\varvec{M}8}}\) + 0.046 (±0.009) \({}_{{\varvec{SS}3}}^{{\varvec{AC}\left[ 4 \right]\_\varvec{N}1}} \varvec{B}_{{\varvec{c} - \varvec{v}}}^{{\varvec{M}12}}\) + 55.958 (±10.078) \({}_{{\varvec{SS}2}}^{{\varvec{AC}\left[ 2 \right]\_\varvec{N}1}} \varvec{B}_{{\varvec{a} - \varvec{c}}}^{{\varvec{M}8}}\) + 0.050 (±0.039) \({}_{{\varvec{SS}4}}^{{\varvec{N}1}} \varvec{Tr}_{{\varvec{e} - \varvec{v} - \varvec{c}}}^{{\varvec{M}19\left( {\varvec{M}12} \right)}}\) + 0.078 (±0.055) \({}_{{\varvec{NS}3}}^{{\varvec{GV}\left[ 2 \right]\_\varvec{K}}} \varvec{F}_{\varvec{a}}^{{\varvec{M}11}}\) + 1.322 (±0.427) \({}_{{\varvec{MP}0}}^{{\varvec{SD}}} \varvec{QuQTr}_{{\varvec{e} - \varvec{v} - \varvec{h}}}^{{}}\) − 0.309 (±0.108) \({}_{{\varvec{MP}4}}^{{\varvec{SD}}} \varvec{QuQTr}_{{\varvec{e} - \varvec{v} - \varvec{h}}}^{{\varvec{M}26\left( {\varvec{M}3} \right)}}\)

THER dataset

 7

0.815

0.7530

0.723

−0.260

0.7248

1.197

Act = –11.296 (±3.486) + 126.508 (±41.628) \({}_{{\varvec{NS}1}}^{{\varvec{GV}\left[ 5 \right]\_\varvec{N}1}} \varvec{B}_{{\varvec{a} - \varvec{c}}}^{{\varvec{M}8}}\) + 0.016 (±0.003) \({}_{{\varvec{NS}1}}^{{\varvec{GV}\left[ 7 \right]\_\varvec{i}50}} \varvec{Q}_{\varvec{e}}^{{\varvec{M}8}}\) − 4.265 (±0.851) \({}_{{\varvec{SS}1}}^{{\varvec{N}1}} \varvec{Tr}_{{\varvec{v} - \varvec{h} - \varvec{c}}}^{{\varvec{M}20\left( {\varvec{M}3} \right)}}\) + 0.718 (±0.171) \({}_{{\varvec{SS}3}}^{{\varvec{RA}}} \varvec{TrC}_{\varvec{e}}^{{\varvec{M}20\left( {\varvec{M}3} \right)}}\) + 0.016 (±0.009) \({}_{{\varvec{SS}4}}^{{\varvec{RA}}} \varvec{TrB}_{{\varvec{e} - \varvec{v}}}^{{\varvec{M}27}}\) − 0.027 (±0.029) \(\left[ {{}_{{\varvec{SS}4}}^{{\varvec{RA}}} \varvec{TrB}_{{\varvec{e} - \varvec{v}}}^{{\varvec{M}27}} } \right]^{A}\) + 0.042 (±0.027) \(\left[ {{}_{{\varvec{SS}4}}^{{\varvec{RA}}} \varvec{TrB}_{{\varvec{e} - \varvec{v}}}^{{\varvec{M}27}} } \right]^{X}\)

THR dataset

 9

0.866

0.8149

0.789

−0.286

0.7674

0.540

Act = 5.251 (±0.605) − 2120.900 (±253.086) \({}_{{\varvec{MP}2}}^{{\varvec{TS}\left[ 1 \right]\_\varvec{i}50}} \varvec{Tr}_{{\varvec{a} - \varvec{h} - \varvec{c}}}^{{\varvec{M}19\left( {\varvec{M}2} \right)}}\) − 0.0001 (±0.) \({}_{{\varvec{NS}0}}^{{\varvec{TS}\left[ 5 \right]\_\varvec{i}50}} \varvec{Tr}_{{\varvec{e} - \varvec{v} - \varvec{h}}}^{{}}\) + 0.060 (±0.013) \({}_{{\varvec{SS}1}}^{{\varvec{AC}\left[ 2 \right]\_\varvec{K}}} \varvec{TrQB}_{{\varvec{a} - \varvec{c}}}^{{\varvec{M}27}}\) + 0.022 (±0.004) \({}_{{\varvec{NS}3}}^{{\varvec{RA}}} \varvec{Tr}_{{\varvec{e} - \varvec{v} - \varvec{h}}}^{{\varvec{M}20\left( {\varvec{M}2} \right)}}\) + 1.415 (±0.222) \({}_{{\varvec{NS}2}}^{{\varvec{RA}}} \varvec{TrQB}_{{\varvec{a} - \varvec{c}}}^{{\varvec{M}20\left( {\varvec{M}8} \right)}}\) + 0.958 (±0.293) \({}_{{\varvec{NS}2}}^{{\varvec{GV}\left[ 4 \right]\_\varvec{PN}}} \varvec{B}_{{\varvec{c} - \varvec{v}}}^{{\varvec{M}8}}\) + 0.107 (±0.041) \({}_{{\varvec{SS}4}}^{\varvec{K}} \varvec{Tr}_{{\varvec{e} - \varvec{v} - \varvec{h}}}^{{\varvec{M}21\left( {\varvec{M}8} \right)}}\) + 0.029 (±0.012) \({}_{{\varvec{MP}4}}^{{\varvec{AC}\left[ 7 \right]\_\varvec{K}}} \varvec{Tr}_{{\varvec{a} - \varvec{e} - \varvec{c}}}^{{\varvec{M}19\left( {\varvec{M}13} \right)}}\) − 0.058 (±0.022) \(\left[ {{}_{{\varvec{SS}1}}^{{\varvec{AC}\left[ 2 \right]\_\varvec{K}}} \varvec{TrQB}_{{\varvec{a} - \varvec{c}}}^{{\varvec{M}27}} } \right]^{\varvec{C}}\)

  1. aSee Additional file 1: Table S7 for nomenclature of the QuBiLS-MIDAS descriptors