1 分布式Logistic组变量选择
1.1 分布式Logistic组变量选择模型
1.2 分布式Logistic组变量选择算法
s.t.βjg=Zjg,∀j=1,2,…,J。
| 算法1 分布式Logistic组变量选择算法 |
|---|
| 1:输入:数据D,预选参数c,步长αZ和αβ,组数量G,机器数J,迭代次数T; 2:对于所有j∈J,Zj(0)=(0,…,0)T,βj(0)=(0,…,0)T,Vj(0)=(0,…,0)T,n= nj; 3:for t=1 to T do 4:for g=1 to G do 5:每台计算机局部运行; 6:使用式(12)更新Zjg(t+1); 7:end for 8:令Zj(t+1)=( (t+1),…, (t+1))T并传输给邻居; 9:for g=1 to G do 10:for u=1 to U do 11:利用式(13)更新 (t+1),令βjg(t+1)= (t+1); 12:end for 13:end for 14:令βj(t+1)=( (t+1),…, (t+1))T并传输给邻居; 15:for g=1 to G do 16:利用式(14)更新Vjig,i=1,2,…,J; 17:end for 18:令Vji(t+1)=( (t+1),…, (t+1))T并传输给邻居; 19:end for 20:输出:β=βj(t),∀j∈J。 |
2 分布式Logistic随机响应组变量选择
2.1 随机响应
| 算法2 随机响应算法 |
|---|
| 1:输入分类数据y={yi ,概率值p; 2:for i=1 to n do 3:if yi=-1 4:if rand>p 5: =-1; 6:else 7: =-1; 8:end 9:end 10:if yi=1 11:if rand>p 12: =-1; 13:else 14: =1; 15:end 16:end 17:end for 18:输出y*={ 。 |
2.2 分布式Logistic随机响应组变量选择算法
| 算法3 分布式Logistic随机响应组变量选择算法 |
|---|
| 1:输入: 数据D,预选参数c,步长αZ和αβ,组数量G,机器数J,迭代次数T,概率p; 2:将y和概率p输入算法2并执行,得到y*; 3:将y*,预选参数c,步长αZ和αβ,组数量G,机器数J,迭代次数T输入算法1并执行,得到估计值β*; 4:输出β*。 |
3 实验
3.1 模拟数据
3.1.1 分布式Logistic组变量选择算法的有效性
3.1.2 分布式Logistic组变量选择算法的高效性
表1 分布式Logistic组变量选择算法的高效性Tab.1 Efficiency of distributed Logistic group variable selection algorithm 单位:s |
| 数据大小 | 算法1(J=5) | 算法1(J=10) | 算法1(J=20) | 算法1(J=1) |
|---|---|---|---|---|
| n=104,p=48 | 102.41 | 52.77 | 28.67 | 496.41 |
| n=104,p=96 | 197.76 | 100.96 | 55.10 | 1 003.79 |
| n=105,p=48 | 998.49 | 528.99 | 259.59 | 5 860.46 |